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本 书 特 色 : 

IBM 原 厂 性 能 优化 专著 

DB2 pureScale 设 计 与 优化 专著 

DB2 数 据 仓 库 设 计 与 优化 专著 
ED HADR 灾 备 最 佳 实践 

iis DB2 V10 最 新 设计 与 优化 技术 

将 Oracle 与 DB2 的 对 比 贯穿 全 书 

融 汇 金融 、 电 信 、 政 府 等 行业 实战 案例 


EXC EJUS MESES: AN ur f 
DB2 从 业 和 人 员 的 案头 必 备 之 作 
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数 子 版 权 声 明 


图 灵 社 区 的 电子 书 没有 采用 专 有 客 
尸 端 ， 您 可 以 在 任意 设备 上 ， 用 自 
己 喜 欢 的 浏览 器 和 PDF 阅读 器 进行 
阅读 。 

但 您 购买 的 电子 书 仅 供 您 个 人 使 用 ， 
未 经 授权 ， 不 得 进行 传播 。 

我 们 愿意 相信 读者 具有 这 样 的 民 知 
ME, SRE ERIRE IN, 


如 果 购 买 者 有 侵权 行为 ， 我 们 可 能 
对 该 用 亡 实 施 包括 但 不 限于 关闭 该 
帐号 每 维权 措施 ， 并 可 能 退 究 法 律 
责任 。 
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IBM 公 司 DB2 资 深 顾问 ， 首 屈 一 指 的 数据 库 
开发 、 维 护 、 优 化 和 架构 专家 。 曾 为 电信 、 银 行 、 
中 央 部 委 、 中 国 高 铁 等 大 型 数据 库 项 目 做 出 了 重要 
贡献 。 发 表 数 据 库 论文 12 篇 ， 拥 有 软件 专利 3 项 。 
每 年 通过 大 量 咨询 、 讲 座 、 培 训 等 方式 ， 为 数据 库 
人 才 更 好 地 运用 数据 库 技 术 做 出 了 最 大 的 努力 。 
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DB2 数 据 库 资深 软件 工程 师 。 多 年 来 一 直 
从 事 DB2 内 核 编译 器 和 优化 器 的 开发 工作 。 擅 长 
DB2 应 用 系统 的 染 构 和 开发 、 大 型 数据 库 性 能 优 
化 ， 对 DB2 人 存储 过 程 的 开 友 和 内 部 运行 机 制 有 很 
深 的 造 齐 。 曾 发 表 多 篇 数据 库 技术 论 文 ， 拥 有 IBM 
DB2 各 项 认证 。 
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DB2 数据 库 是 IBM 公司 数据 管理 产品 线 上 最 知名 也 是 最 成 功 的 产品 ， 不 仅 在 大 型 主机 市 
场 处 于 绝对 领导 地 位 ， 而 且 在 开放 式 平 台 的 影响 力 更 是 与 日 俱 增 ， 不 断 地 有 客户 从 Oracle 迁移 
到 DB2. 

说 起 DB2 的 悠久 历史 ， 实 际 上 它 起 源 于 一 篇 具有 划时代 意义 的 论文 。1970 年 ，IBM 公司 
的 研究 员 挨 德 加 。 考 特 (Edgar F. Codd) 发 表 了 名 为 “大 型 共享 数据 库 的 关系 模型 ”(4 Relational 
Model of Data for Large Shared Data Banks) WAX, AW ERAI T RREA SEK. MA 
那 时 起 ，IBM 公司 惑 一 直 在 数据 库 这 个 领域 深耕 细作 ， 持 续 创 新 ， 通 过 不 断 研发 优秀 的 产品 屹 
立 于 强手 如 林 的 科技 界 ， 表 现在 DB2 研发 上 更 是 不 断 的 推陈出新 。 下 面 是 DB2 发 展 史上 上 共有 
香 要 里 程 碑 意 义 的 版 本 ， 它 们 一 经 推出 就 获得 了 业界 的 广泛 好 评 。 

1983 年 ，DB2 正式 问世 ， 被 IBM 大 型 机 所 专用 ， 之 所 以 命名 为 DB2， 是 由 于 以 前 已 经 有 
了 一 个 着 名 的 层次 型 数据 库 产 品 Information Management System (IMS) 。 

1992 Œ, IBM 将 DB2 市 向 了 多 种 开放 式 平台 ， 包 括 Linux, Unix 以 及 Windows 服务 器， 
也 简称 为 DB2 LUW. 

2002 年 ,IBM 发 布 了 DB2 V8, 这 个 版 本 开始 文 持 数据 库 分 区 特性 (Data Partitioning Feature, 
DPF) ， 从 而 通过 非 分 享 (Share Nothing) 的 MPP 架构 为 数据 仓库 提供 更 强 的 伸缩 性 。 

2006 F, IBM 发 布 了 DB2 V9， 这 个 全 新 的 DB2 是 第 一 款 “ 天 然 ” 存 储 XML 的 关系 型 数 
据 库 。 

2008 F, IBM 发 布 了 DB2 V9.7, 提供 了 Oracle 4E RETE, XX ose xd Oracle 语法 ， 
从 而 大 大 方便 了 应 用 和 数据 库 迁 移 。 

2009 年 ，IBM 发 布 了 DB2 V9.8， 增 加 了 DB2 pureScale 特性 ， 该 特性 利用 了 z/OS 大 型 机 

上 经 过 验证 的 DB2 数据 库 集 群 技 术 ， 在 开放 平台 上 实现 了 共享 磁盘 (Share Disk) 架构 ， 以 满 
AE i dr HESS OLTP 应 用 对 高 可 用 性 、 扩 展 性 和 负载 均衡 的 需要 。 

2012 Œ 4 H, IBM X8 Y DB2 V10， 该 版 本 提供 了 多 时 态 表 、 多 表 星 型 连接 、 行 列 访问 
控制 (RCAC) 、 多 温度 存储 、 目 适应 压缩 等 特性 。 在 这 个 版 本 中 ，DB2 pureScale 技术 得 到 了 
进一步 完善 ， 从 而 获得 了 很 多 行业 客户 的 高 度 认 可 ， 有 目 前 DB2 pureScale 已 经 在 中 国 金 融 、 航 
宇 、 烟 草 等 行业 的 生产 库 上 得 到 了 成 功 实施 。 

2012 年 10 H, IBM 正式 推出 了 数据 库 一 体 机 PureData。 该 产品 不 同 于 竞争 对 手 的 文 持 混 
合 负载 一 体 机 ， 而 是 针对 交易 处 理 、 分 析 和 操作 分 析 这 三 种 应 用 场合 分 别提 供 不 同 的 软 便 件 预 
配置 解决 方案 。 

HEEE. RIA IBM 中 国 开 发 中 心 已 经 快 20 年 了 ， 在 这 里 非常 荣幸 见证 了 中 国 工 程 师 
DB2 研发 实力 的 快速 提高 。 从 刚 开 始 接 一 些 向 单 的 开发 工作 , 到 现在 参与 DB2 最 新 的 核心 技术 
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开发 ; 从 刚 开始 国外 团队 对 中 国 工程 师 工 作 能 力 的 半信半疑 ,到 现在 获得 国外 DB2 团队 的 信任 
和 认可 ， 这 说 明 中 国 开发 中 心 在 IBM 全 球 的 研发 地 位 变 得 越 来 越 重 要 了 。 当 然 ， 除 了 研发 最 新 
的 DB2 核心 技术 外 ， 中 国 开 发 中 心 还 作为 培养 中 国 DB2 人 才 的 “黄埔 军校 ”， 增 养 了 一 大 批 
技术 文 持 和 服务 客户 的 优秀 工程 师 。 

成 绩 是 非常 突出 的 ， 但 是 存在 的 一 些 问 题 也 毋庸 讳 言 。 在 数据 库 用 户 中 ， 精 通 Oracle 的 人 
非常 多 ， 但 是 精通 DB2 开发 、 维 护 和 优化 的 人 就 相对 比较 少 了 ， 这 在 一 定 程度 上 影响 了 DB2 
产品 的 使 用 。 其 实 , 说 到 底 这 是 DB? 生态 系统 的 问题 。 作 为 原矿 来 说 ，IBM 公司 是 非常 愿意 通 
过 各 种 方式 和 途径 推广 DB2 产品 技术 的 ， 例 如 通过 和 db2china 社区 的 紧密 合作 ， 定 期 由 来 自 
中 国 研发 中 心 的 资深 工程 师 在 db2china 社区 上 轮值 来 解答 用 户 的 棘手 问题 ， 中国 开 发 中 心 也 会 
和 db2china 社区 定期 举办 DB2 沙龙 以 更 有 效 地 传播 DB2 新 技术 ， 这 些 努 力 都 取得 了 非常 好 的 
效果 。 

近 几 年 来 ， 我 们 还 逐渐 加 大 了 对 IBM 客户 和 合作 伙伴 的 支持 力度 。 针 对 DB2 客户 ， 我 们 于 
2011 年 在 大 中 华 区 成 立 了 DB2 客户 顾问 委员 会 ， 简 称 DB2 CAC， 目 前 来 自 银行 、 电 信 、 保 险 、 
制造 等 不 同行 业 的 多 个 客户 已 经 加 入 了 这 个 委员 会 。 这 种 方式 加 强 了 DB2 实验 室 和 客户 之 间 的 
双向 交流 与 合作 ， 我 们 为 客户 安排 了 实验 室 顾问 (Lab Advocate) ， 问 他 们 介绍 DB2 最 新 的 技 
术 发 展 ， 客 户 也 可 以 把 他 们 对 DB2 产品 的 需求 提供 给 DB2 开发 团队 ， 这 种 方式 收 到 了 非常 显 
车 的 效果 。 男 外 ,针对 合作 伙伴 ,我 们 今年 成 立 了 一 个 合作 伙伴 委员 会 (Business Partner Council) 
以 帮助 IBM 重要 合作 伙伴 在 他 们 的 业务 系统 中 使 用 好 DB2。 

实际 上 ， 除 了 IBM 官方 的 积极 推动 外 ， 类 似 《DB2 设计 、 管 理 与 性 能 优化 艺术 》 这 样 的 
DB2 书籍 也 是 一 种 非常 有 效 的 技术 推广 方式 。 这 本 书 由 来 自 IBM 中 国 开发 中 心 的 DB2 资深 工 
程 师 编号， 具备 科学 的 性 能 优化 知识 体系 ， 以 大 量 实战 案例 为 载体 ， 不 仅 展示 了 DB2 经 典 设计 
和 优化 方法 学 ， 还 涵盖 了 DB2 高 级 设计 和 优化 技术 ， 例 如 DB2 HADR, DB2 pureScale 集群 、 
数据 仓库 等 。 这 对 奋战 在 数据 库 应 用 开发 与 优化 一 线 的 DB2 用 户 来 说 ， 可 以 说 是 找到 了 一 把 进 
入 DB2 技术 圣 殿 的 金 钥匙 ， 项 望 广大 读者 能 从 中 获 益 。 


IBM 中 国 开 发 中 心 DB2 开发 与 客户 支持 总 监 
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去 国 离 家 十 四 载 后 ，2009 年 ， 当 我 再 次 从 IBM 多 伦 多 实验 室 归 来 凝视 上 海 这 座 不 夜 城 时 ， 
不 由 地 感慨 世界 真 的 变 小 了 、 变 平 了 ， 中 国 作 为 地 球 村 的 一 员 ， 正 以 尺 人 的 速度 发 展 变化 看 ， 
而 我 的 工作 也 一 样 在 发 展 变 化 者 。 从 加 拿 大 回国 后 于 2010 年 正式 加 入 IBM 中 国 软件 开发 实验 
室 ， 由 之 前 的 DB2 数据 管理 工作 ， 转 而 开始 从 事 数 据 治 理 (Data Governance) 方面 的 工作 。 

过 去 的 十 年 是 企业 的 IT 系统 数据 量 高 速 膨 胀 的 时 期 ，“ 大 数据 ”时 代 已 悄然 来 临 : 每 天 ， 
授 布 世界 各 个 角 洲 的 传感器 、 移 动 设备 、 在 线 交 易 和 社交 网 络 生 成 上 百 万 兆 字 方 的 数据 ; 每 个 
月 ， 人 类 发 布 10 亿 条 Twitter 信息 和 300 亿 条 Facebook 信息 。 据 统计 ， 全 球 9096 的 数据 
都 是 在 过 去 两 年 中 生成 的 。 

“大 数据 ”时 代 必 然 会 产生 新 的 “大 数据 ”问题 。 哪 些 数 据 是 可 信 的 ? 哪些 数据 需要 进行 
清洗 ?如 何 从 海量 数据 中 获得 业务 洞察 力 ， 从 而 指导 商业 决策 ? 如 何 确保 新 录入 的 信息 不 会 产 
ECR? 如 何以 可 复 用 的 方式 发 布 可 信任 的 信息 ? 如 何 使 旭 此 庞大 的 数据 真正 变 成 对 企业 有 价 
值 的 信息 ? 这 些 海 量 的 、 分 散在 不 同 角 沙 的 数据 融 来 了 资源 利用 的 复杂 和 管理 的 困难 等 问题 。 

以 上 所 述 各 种 问题 ， 最 终 的 解决 办 法 就 是 要 菲 数 据 治 理 。〔 在 很 多 时 候 我 们 用 一 个 更 为 精 
确 的 概念 一 一 信息 治理 ) 数据 治理 是 专注 于 将 数据 作为 企业 的 商业 资产 进行 应 用 和 管理 的 一 套 
管理 机 制 。 民 好 的 数据 治理 能 够 消除 数据 的 不 一 致 性 ， 提 高 组 织 数据 质量 ， 建 立 规范 的 数据 应 
用 标准 ， 实 现 数 据 广泛 共享 ， 并 能 够 将 数据 作为 企业 的 宝贵 资产 应 用 于 业务 、 省 理 、 战 略 决 集 
中 ， 发 挥 数据 资产 的 最 大 商业 价值 。 

这 几 年 ， 数 据 治理 在 国内 的 研究 和 应 用 都 取得 了 一 定 进展 ， 但 是 也 面临 观念 上 和 实践 上 的 
双重 挑 成 。 从 观念 上 看 , 国内 很 多 人 认为 数据 治理 只 是 IT 部 门 的 员 任 , 只 把 数据 治理 当成 软件 ， 
并 未 真正 意识 到 业务 、 数 据 和 软件 之 间 的 关系 , 也 就 不 能 从 整体 上 将 数据 作为 企业 资产 来 看 竺 。 
从 实践 上 看 ， 很 多 企业 做 了 数据 质量 检查 ， 做 了 数据 归档 ， 做 了 数据 安全 ， 但 缺乏 一 个 完整 的 
体系 来 将 各 个 部 分 串联 起 来 ， 也 就 是 说 ， 缺 乏 将 这 些 领 域 组 织 起 来 的 方法 论 。 

为 了 帮助 企业 更 好 地 管理 数据 资产 ， 应 用 大 数据 时 代 信 息 治 理 的 挑 成 ，IBM 推出 了 全 新 的 
信息 管理 和 业务 分 析 产 品 ， 并 提供 技术 资源 ， 致 力 于 为 企业 及 机 构 提 供 大 数据 分 析 、 信 息 整 合 、 
主 数据 管理 等 数据 治理 解决 方案 。 以 下 都 是 基于 IBM 数据 治理 方案 的 优秀 软件 。 

IBM InfoSphere BigInsights 是 IBM 大 数据 平台 的 核心 产品 之 一 ， 它 是 一 球 以 Hadoop 为 基础 
的 、 对 海量 数据 进行 存储 、 管 理 和 分 析 的 企业 级 平台 。 可 以 在 30 分 钟 内 安装 完毕 并 投入 运行 ， 
可 用 来 管理 企业 各 种 数据 ， 比 如 大 量 来 目 社 交 网 络 、 移 动 设备 和 传 感 絮 等 不 同 来 源 的 非 结构 化 数 
据 ， 并 对 这 些 数据 进行 深度 挖 气 和 分 析 。 

IBM InfoSphere Information Server. 系列 软件 支持 将 大 数据 作为 来 源 和 目标 进行 整合 ,并 和 凭借 
其 成 熟 可 车 的 性 能 和 并 行 引擎 ， 提 供 大 数据 所 需 的 强大 可 扩展 性 ， 包 括 元 数据 管理 、 数 据 清洗 、 
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数据 质量 治理 及 分 析 、 数 据 上 日 动 化 分 析 、 数 据 抽取 转换 加 载 、 数 据 集成 、 监 控 与 报告 等 一 整套 软 
件 组 成 的 企业 级 信息 平台 。 通 过 它 可 分 析 、 清 洗 和 整合 寞 构 源 中 的 数据 信息 ， 并 且 把 经 过 分 析 、 
清理 后 的 可 信任 信息 以 可 复 用 的 方式 提供 给 用 户 ， 同 时 也 对 新 录入 的 信息 进行 实时 的 数据 清洗 操 
作 ， 保 证 狐 录 入 信息 的 正确 性 。 

IBM InfoSphere Master Data Management 软件 , 其 最 核心 的 任务 是 导出 企业 的 关键 业务 数据 ， 
也 是 绝对 真实 的 数据 。 主 数据 管理 上 在 从 企业 的 多 个 业务 系统 中 整合 最 核心 的 需要 共 宇 的 数据 ， 
集中 进行 数据 清洗 ， 并 以 服务 的 方式 把 统一 、 完 整 、 准 确 的 主 数据 分 发 给 企业 内 的 操作 型 应 用 和 
分 析 型 应 用 ， 包 括 业 务 系统 、 业 务 流程 和 决策 文 持 系统 等 。 使 用 户 更 深入 地 理解 生产 链条 上 的 各 
个 要 素 一 一 客户 、 产 品 、 供 应 商 、 员 工 等 之 间 的 关系， 为 进一步 分 析 和 决策 做 重要 文 撑 。 

IBM InfoSphere Stream 是 IBM 大 数据 平台 中 专门 针对 快速 产生 的 如 流水 般 不 间断 的 海量 数 
据 流 的 处 理 平台 。 它 是 一 个 文 持 开发 和 部 蜀 的 应 用 程序 平台 。 能 够 持续 快速 地 分 析 实 时 产生 的 各 
种 各 样 的 海量 流 数 据 。 具 有 低 延 人 运 、 实 时 啊 应 、 跟 多 个 数据 流 进行 分 析 的 特点 ， 尤 其 适用 于 对 啊 
应 时 间 有 较 高 要 求 的 应 用 ， 例 如 其 诈 检 测 、 网 络 管理 ， 能 很 好 地 解决 企业 处 理 数据 量 大 、 存 储 成 
本 蜗 的 问题 。 通过 直接 对 数据 进行 分 析 ， 无 须 存储 ， 从 而 实现 对 有 价值 数据 进行 深入 分 析 的 可 能 。 
能 够 在 大 规模 的 集群 环境 中 并 行 、 高 性 能 地 处 理 流 数据 ， 并 有 共有 近似 于 线性 的 可 扩展 性 ， 是 帮助 
企业 处 理 实时 化 的 海量 流 数 据 分 析 的 好 帮手 。 

谈 了 不 少数 据 治理 , 那么 它 和 DB2 数据 管理 有 什么 不 同 ?” 我 想 分 吝 一 下 我 的 观点 。 如 条 说 
从 事 数 据 质 量 管理 、 主 数据 管理 等 数据 治理 工作 的 人 是 数据 巨轮 的 舱 长 ， 他 们 平时 的 工作 残 是 
HERE, FA we A ARR HUS E a S Bim; bdUdep 354 A3 DB2 fH 
天 工作 的 DBA WEERA LESS va. MKAN 132903 R EN 23035 EE TI ESTRAE 
要 人 作用。 但是， 在 实际 工作 中 ， 我 经 常 发 现 这 样 的 事情 : 当 舰 桥 上 传 来 船长 焦急 的 指令 ， 命 令 
DBA 加 快 数据 流动 的 速度 时 ，DBA m T 4 5526 DB2 的 优化 技巧 ， 只 能 回答 说 ，“DB2 引擎 
B SITEBEXRA P. HET ”。 虽 然 骨 长 的 指令 很 及 时 ， 但 过 到 这 样 的 朋 员 ， 数 据 巨 轮 灰 怕 也 运 
转 不 佳 了 。 

DB2 船员 的 实际 水 平 制约 了 船 长 对 数据 巨轮 的 驾驶 能 力 。 本 书 束 是 一 本 供 DB2 船员 行驶 
的 实战 手册 , 希望 广大 山 员 能 真正 理解 和 掌握 书 中 讲述 的 DB2 设计 与 性 能 优化 和 艺术， 当 收 到 船 
长 要 求 加 速 数据 流动 的 命令 时 ,可 以 让 DB2 引擎 运行 得 更 好 ,， 这样 数据 巨轮 就 能 畅通 无 阻 得 行 
NP. 


IBM 中 国 开 发 中 心 信息 管理 产品 开发 部 
UE 资深 主管 经 理 
2013 年 6 月 8 日 


Ho 


IBM 百年 华诞 ， 在 2011 FHIL, ERER. GEL, XXE IBM 能 屹立 于 强手 如 林 的 科 
技 界 的 关键 ， 使 得 她 能 够 适应 科技 时 代 发 展 的 需要 ， 不 断 创新 求 变 ， 从 而 把 握 时 代 的 脉搏 ， 解 
决 今天 以 及 未 来 企业 遇 到 或 可 能 遇 到 的 重大 挑战 。 

进入 21 EZ, IBM 与 其 众多 对 手 们 不 约 而 同 地 投入 到 了 信息 时 代 的 苋 争 。 随 看 信息 技术 
的 迅猛 发 展 , 作为 其 核心 组 成 部 分 的 数据 之 战 已 成 为 了 21 世纪 “竞争 ”的 新 内 涵 ， 而 作为 承载 、 
处 理 和 加 工 这 些 数据 的 数据 库 软 件 行业 就 不 可 避免 地 成 为 了 主 战 场 。 

为 了 满足 客户 各 种 需求 , 大 家 苋 争 的 对 象 是 极 定 生命 力 的 数据 。 在 数据 的 整个 生命 历程 中 ， 
它 会 经 历 设 计 、 开 发 、 部 署 、 运 营 、 优 化 和 治理 的 不 同 阶段 ， 并 且 这 不 是 一 次 性 的 过 程 ， 而 是 
通过 周期 性 的 迭代 方式 ， 来 友 挥 数据 更 大 的 价值 。 任 何 一 家 企业 拥有 了 对 数据 强大 的 管控 和 文 
配 ， 它 束 会 在 21 世纪 数据 之 战 中 立 于 不 败 地 位 ， 甚 至 引领 信息 时 代 的 发 展 。 

IBM 正在 看 手 于 实现 一 个 战略 计划 ,提供 一 个 集成 的 模块 化 数据 管理 环境 ,帮助 企业 更 高 
效 准 确 地 管理 整个 数据 生命 周期 《从 需求 到 报废 ) 。 我 们 将 这 个 过 程 称 为 “集成 数据 管理 ”， 
管理 数据 生命 周期 的 每 个 环 世 ， 并 能 够 文 持 各 种 主流 三 商 提供 的 数据 管理 技术 ， 这 包括 DB2、 
Informix、Oracle 等 。 

本 文中 提 到 的 IBM Optim Tools， 束 是 应 运 而 生 的 这 样 一 个 工具 集 ， 它 除了 提供 对 数据 库 
基本 的 管理 和 开发 功能 外 ， 还 提供 了 强大 的 DB2 监控 和 优化 功能 。IBM Optim Tools 最 大 的 优 
势 束 在 于 对 DB2 数据 库 全 面 的 文 持 ， 能 够 及 时 地 反映 并 紧 跟 上 DB2 数据 库 的 发 展 和 更 新 ， 例 
如 对 DB2 数据 仓库 和 DB2 pureScale 的 支持 。 

本 书 的 作者 都 有 非常 丰 军 的 数据 库 管 理 和 优化 经 验 ， 使 得 本 书 共 有 极 佳 的 实践 性 和 可 操作 
性 ， 相 信和 能 为 广大 的 数据 库 用 户 提 供 前 所 未 有 的 帮助 。 


IBM 中 国 开 发 中 心 信 息 管 理 产 品 开 发 部 
资深 经 理 孙 冰 江 
9013 年 6 月 28 日 写 于 北京 


序 四 


我 和 乓 膨 在 几 年 前 的 一 次 InfoSphere 培 训 中 结识 ， 基 于 对 DB2 的 共同 爱好 ， 我 们 经 常 探 讨 
关于 DB2 的 各 种 技术 ， 受 荔 庙 丰 。 如 今 飞 鹏 的 舞动 DB2 系 列 专 于 已 经 陆续 出 版 上 市 ， 作 为 已 
经 阅读 过 舞动 DB2 系 列 书 籍 的 读者 ， 我 想 说 ， 这 套 专 车 的 理论 水 平 给 庸 置疑 ， 实 际 案例 更 是 经 
验 和 吞 苇 的 结晶 ， 对 于 使 用 DB2 的 各 个 层次 的 读者 都 会 有 很 大 帮助 。 

这 次 ， 新 书 《DB2 设 计 与 性 能 优化 亏本 》 即 将 上 市 了 ， 我 受 飞 肋 之 邀 为 本 书 作 序 ， 感 到 十 
Apes 

完 讲 讲 我 和 数据 库 的 故事 。 我 从 1992 年 开始 使 用 数据 库 ， 最 初 是 用 FOXBASE 开 发 了 一 
个 工资 管理 系统 。1995 年 开始 基于 DB2 for AS400 的 银行 应 用 开发 。1997 年 开始 基于 SYBASE 
的 证 券 应 用 开发 。1998 年 开始 从 一 名 开发 者 转 癌 系统 工程 师 ， 开 始 了 中 间 件 和 数据 库 方面 的 技 
术 支 持 。1999 年 获得 DB2 V5 DBA 认 证 。1999 年 ~2006 年 ， 先 后 做 过 SYBASE、DB2、Oracle 
数据 库 的 规划 设计 、 系 统管 理 、 故 障 排除 、 性 能 优化 、 开 发 指导 等 工作 。2007 年 开始 主要 天 
注 和 研究 IEBM 软 件 ， 提 供 主流 数据 库 、 数 据 仓库 、 数 据 迁 移 、 灾 难 备份 的 咨询 及 增 训 服务 。 到 
目前 为 止 ， 我 拥有 DB2 从 版 本 5 到 版 本 10 的 DBA 认 证 、DB2 版 本 9 的 高 级 DBA 认 证 、Oracle 
11G DBA OCP 认 证 、Informix 10 和 11 的 DBA 认 证 以 及 IBM 的 InfoSphere 及 Tivoli 的 各 种 认证 
40 余 个 。 目 前 担任 IBM 官 方 认证 讲师 ， 负 贡 十 多 项 产品 的 培训 工作 。 

虽然 我 做 过 各 种 类 型 的 数据 库 工 作 ， 但 是 数据 库 的 设计 与 优化 无 疑 是 一 项 很 重要 有 日 关键 的 
工作 。 说 起 数据 库 优 化 ， 先 给 大 家 讲 一 个 故事 。 华 伦 兄 弟 三 人 都 精通 医术 ， 有 一 天 一 个 人 问 华 
化 ， 你 们 家 里 兄 第 三 人 谁 的 医术 最 高 ， 这 时 华 化 说 : 我 们 家 大 哥 的 医 林 最 高 明 ， 其 次 是 我 的 二 
可 ,医术 最 差 的 就 是 我 了 。 提 问 者 十 分 不 解 地 问 : 所 有 人 都 知道 你 是 天 下 最 有 名 、 医 术 最 高 的 
人 和 人 了， 怎么 还 有 比 你 医术 更 启明 的 人 ? 于 是 华 化 说 了 一 段 非常 耐人寻味 的 话 : “我 大 哥 治 病 是 
在 人 们 尚未 察觉 身体 有 病 的 时 候 为 人 们 医治 的 ， 人 们 对 他 医术 不 甚 了解 。 我 二 哥 治 病 是 在 人 们 
开始 发 病 的 时 候 通过 望 闻 问 切 ， 开 处 方 医治 病人 的 ， 人 们 只 是 对 他 有 上 所 了 解 。 我 看 病 是 在 病人 
的 病情 非常 严重 的 时 候 ， 才 给 病人 下 药 ， 所 以 人 们 认为 我 能 够 让 人 起 死 回 后， 因此 我 最 有 名 和气， 
但 是 论 医 术 水 平 我 与 我 的 兄长 差距 很 大 蚜 ! ”其 实 DBA 就 像 是 数据 库 的 医生 ， 数 据 库 的 性 能 
优化 也 有 三 个 阶段 : 第 一 个 阶段 是 ， 数 据 库 性 能 出 现 严 重 问题 时 去 诊断 分 析 、 提 出 整改 方案 ， 
即使 能 起 死 回 生 ， 但 由 于 之 前 的 规划 设计 缺陷 很 难 达 到 持续 稳定 健康 的 运行 ， 第 二 阶段 是 ， 在 
数据 库 运 维 过 程 及 时 发 现 问题 解决 问题 ， 但 同样 也 受 限 于 之 前 的 规划 设计 ; 第 三 个 阶段 是 ， 在 
数据 库 规 划 设 计 阶 段 就 开始 考虑 性 能 问题 ， 这 是 性 能 优化 的 最 高 境界 。 所 以 设计 与 性 能 优化 是 
分 不 开 的 ， 这 也 是 本 书 所 关注 和 阐述 的 。 

通过 十 多 年 的 数据 库 经 验 ， 强 烈 地 感觉 到 数据 库 设计 与 性 能 优化 需要 了 解数 据 库 之 外 的 很 
多 相关 知识 ， 比 如 : 操作 系统 、 存 储 、 网 络 、 中 间 件 ， 这 些 知识 是 相互 关联 和 影响 的 ， 既 而 成 


2 —^ BER X55 Ig IRE. PEREGUSESERUERE,. EE RANA IS fuos AS IBI. DBA IS] — 
个 剑客 ， 借 用 电影 《英雄 》 的 台词 : “ 剑 法 有 三 种 境界 : 第 一 种 ， 手 中 有 剑 、 心 中 却 无 剑 ， 主 
要 练 束 的 是 一 招 一 式 ; 第 二 ， 手 中 有 剑 、 心 中 有 剑 ， 所 谓 人 剑 合 一 ， 练 融 的 是 剑 气 ， 第 三 ， 
手中 无 剑 、 心 中 也 无 人 环 ， 是 一 种 至 大 则 空 的 平和 。 第 三 种 被 称 为 剑 法 的 最 融 境 界 。” 第 一 
种 ， 手 中 有 剑 、 心 中 却 无 剑 : 这 种 境界 的 DBA 知 道 很 多 DB2 的 命令 及 用 法 ， 但 对 这 些 命令 及 


用 法 的 使 用 场景 是 售 匹 配合 适 则 无 所 适 从 。 第 二 种 ， 手 中 有 剑 ， 心 中 有 介 : 知道 很 多 命令 
及 用 法 ， 也 知道 这 些 命令 及 用 法 的 适用 场景 ， 也 能 做 到 活 学 活用 。 第 三 种 ， 手 中 无 剑 、 心 中 
也 无 剑 : 不 再 使 用 现成 的 东 茶 高 手写 的 安 狠 指南 、 运 维 指南 等 ， 不 再 仪 关 注 于 数据 库 ， 而 更 
多 地 是 利用 DB2 的 信息 中 心 ， 通 过 全 面 地 系统 感悟 ， 做 到 IT 系统 为 我 服务 ， 我 来 规划 设计 IT 
系统 。 到 了 这 个 境界 ， 就 不 会 纠结 于 要 学 习 DB2 还 是 Oracle， 因 为 两 者 的 很 多 东西 都 是 相通 
的 。 希望 本 书 能 引导 读者 走 问 DBA 的 最 局 境界 。 


北京 富 通 东方 科技 有 限 公 司 技 术 服 务 中 心 副 总 经 理 
张 东 焕 
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“三 方 演义 ”与 性 能 优化 


性 能 优化 为 什么 这 么 难 ? 

一 个 T 系统 建设 的 过 程 ， 其实 束 是 “三 方 演义 ”的 过 程 。 这 里 的 三 方 ， 束 是 客户 方 、 开 发 
RAI IBM 原 厂 ， 通 第 是 客户 所 需求 ， 开 发 商 负 贡 应 用 设计 和 开发 ，IBM 提供 软 便 件 产品 ， 系 统 
完成 开发 后 ， 由 客户 或 者 第 三 方 公司 运行 维护 。 一 个 IT 系统 的 好 坏 ， 取 决 于 这 三 方 能 否 紧密 合 
作 ， 能 人 否 发 挥 各 目 独 特 的 优势 ， 从 而 实现 1+1+1>3 的 效果 。 

类 似 于 IT 系统 建设 ， 一 个 上 规模 的 性 能 优化 项 目 ， 也 是 “三 方 演义 ”的 互动 过 程 。 我 经 历 
过 一 坚 烂 尾 项 目 ， 这 种 项 目 在 司 动 的 时 候 ， 大 家 坐 在 一 起 指点 江山 ， 高 谈 政治 ， 担 脑袋 做 决定 ， 
当 出 现 性 能 问题 的 时 候 非 常 浮躁 ， 不 能 冷 廊 客观 地 分 析 问 题 和 解决 问题 ， 而 是 叫喊 看 用 更 局 档 
的 价 件 ， 缺 乏 严 谨 、 务 实 、 执 看 和 求 真 的 精神 ， 缺 乏 对 性 能 优化 项 目 最 起 人 码 的 敬 戎 感 。 

上 自 先 是 客户 方 。 钱 是 客户 出 的 ,客户 是 上 正 的 甲 方 ， 所 以 客户 忌 是 最 强势 ， 冤 户 领 导 经 生 
在 会 议 上 发 写 施 令 ， 当 过 到 问题 的 时 候 把 开发 商号 得 一 塌 糊 涂 : “看 看 你 们 写 的 垃圾 代码 ， 还 
想 让 我 们 购买 更 好 的 便 件 ?”” 或 者 写 原 三: “你 们 说 过 DB2 提供 的 目 动 维护 特性 不 需要 DBA 
过 多 干预 ， 但 为 啥 根本 不 是 那么 回 事 呢 ? ”加 归 写 ， 出 了 问题 其 实 客户 也 是 有 责任 的 ， 你 为 啥 
不 要 下 喘 段 ， 真 正 参 与 到 系统 的 设计 、 开 发 和 维护 的 整个 过 程 呢 ? 这 样 即使 出 了 问题 ， 心 里 也 
有 底 了 呀 。 但 是 ,现实 中 又 很 难 ， 因 为 这 和 客户 内 部 的 体制 有 关 ， 通 币 在 一 个 项 目的 不 同 阶段 ， 
各 个 部 门 融 像 “ 铁 路 警察 ， 各 管 一 段 ”， 开 发 部 门 上 只 管 开 发 ， 运 维 部 门 上 只 负责 上 线 维护 ， 运 维 
部 门 和 开发 部 门 是 各 目 为 战 ， 当 出 了 问题 后 ， 相 互 中 记 球 ， 协 调 起 来 非常 困难 。 例 如 ， 人 金融 业 
的 客户 ， 一 般 拥 有 目 己 专门 的 开发 部 门 和 运 维 部 门 ， 两 个 部 门 独立 ， 不 存在 上 下 级 隶属 关系 ， 
过 到 困难 后 很 容易 相互 扯皮 。 全 于 电信 业 和 政府 部 门 ， 出 了 系统 性 问题 更 难 协 调 : 电信 业 的 客 
F, 通常 只 负责 系统 维护 工作 ,应 用 开发 通常 由 第 三 方 的 开发 丙 负 责 ; 政府 客户 ， 只 负责 需求 、 
系统 规划 和 管理 工作 ， 开 发 和 维护 都 是 由 第 三 方 公 司 承担 的 。 针 对 客户 方 ， 我 想 强调 的 是 ， 没 
有 专业 分 工 的 局 面 是 可 怕 的 ， 但 太 过 于 精细 的 分 工 同样 效率 低下 ， 更 可 怕 的 是 很 多 企业 采用 政 
治 挂 帅 的 方式 局 动 和 管理 项 目 ， 这 是 导致 烂 尾 的 重要 根源 之 一 。 

接 下 来 谈 谈 开 发 商 。 开 发 丙 是 摊 客 户 写 最 多 的 了 ， 但 并 不 妨碍 他 们 喜欢 拍 胸 且 ， 哈 都 敢 承 
诡 ， 啥 都 敢 做 ， 毕 竞 有 其 独特 优势 。 开 发 商 有 人 力 资 源 的 优势 ， 手 中 有 大 量 的 开 友 人 员 可 供 使 
H: 开发 商 还 有 对 业务 理解 的 优势 ， 毕 葛 开 发 商 长 期 和 行业 客户 在 一 起 ， 积 素 了 很 多 业务 经 验 
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和 知识 ; 通 第 开发 商 还 有 关系 的 优势 ， 毕 竟 从 客户 那 拿 项 目 ， 是 要 和 客户 关系 融洽 、 有 信誉 才 
行 。 但 是 ， 开 发 商 也 有 技术 硬 伤 ， 那 就 是 对 系统 软件 ， 包 括 硬 件 、 数 据 库 、 中 间 件 等 的 使 用 水 
平 还 停留 在 安装 配置 的 层面 ， 缺 乏 对 其 内 部 机 制 的 了 解 ， 押 以 在 架构 规划 、 数 据 库 优 化 、 高 可 
用 性 测试 、 可 扩展 性 测试 等 方面 技术 上 做 不 到 甚至 没有 这 方面 的 意识 ， 更 不 可 能 实施 了 。 

最 后 谈 谈 原 三。 原矿 的 人 员 也 会 挨 回 ， 也 会 被 开发 商 拿 来 当 挡 箭牌 ， 这 不 新 鲜 。 原 三 有 日 
己 的 核心 优势 ， 那 就 是 对 自身 产品 的 深入 理解 ， 以 及 跨 金 融 、 电 信 、 政 府 等 各 行业 应 用 所 积累 
的 实施 优势 ， 这 必 将 在 架构 规划 、 数 据 库 优 化 、 扩 展 性 测试 等 需要 技术 深度 和 经 验 的 领域 发 挥 
重要 作用 ， 也 可 以 为 客户 和 开发 人 员 在 设计 、 开 发 和 运 维 等 工作 上 提供 至 关 重 要 的 技术 文 持 。 
但 是 ， 原 广 也 有 做 的 不 够 好 的 地 方 ， 其 实 也 是 体制 上 的 原因 ， 那 驶 是 以 围绕 产品 的 技术 文 持 为 
主 ， 如 果 在 推动 最 新 的 技术 和 产品 给 客户 的 同时 能 愿意 多 倾听 客户 的 真正 需求 ， 如 果 能 积极 主 
动 参与 到 项 目 规划 、 设 计 、 开 发 、 测 试 和 运 维 的 整个 阶段 ， 那 将 对 IT 系统 质量 的 提升 发 挥 重要 
WH. 

在 这 样 一 个 “三 方 演义 ”的 架构 下 ， 要 想 完 成 性 能 优化 工作 有 时 候 超 越 了 技术 本 号 ， 它 更 
多 地 需要 设计 开发 人 员 和 运 维 人 员 的 紧密 配合 。 比 如 ， 当 我 发 现 SQL 语句 的 问题 ， 需 要 开发 人 
员 文 持 和 配合 的 时 候 ， 却 被 告知 项 目 己 经 被 开发 商 交 付 给 客户 了 ， 没 有 办 法 找到 开发 人 员 了 。 
有 时 候 我 即使 找到 了 开发 人 员 ， 他 们 却 对 SQL 语句 的 最 终 运 行 环境 一 点 都 不 关注 ,他 们 只 是 强 
调 SQL 语句 是 业务 届 辑 的 需要 。 于 是 ， 我 不 得 不 找 运 维 人 员 寻 求 文 持 ， 但 是 运 维 人 员 让 我 更 吃 
惊 ， 他 们 只 关注 主机 、 操 作 系 统 和 数据 库 本 身 ， 对 上 层 应 用 缺乏 了 解 ， 也 不 关注 上 层 SQL 语句 
AE A ES TJ e 

这 可 能 是 国内 IT 系统 建设 的 一 个 缩影 吧 ， 所 以 在 此 我 仅 提 出 一 条 呼吁 性 质 的 建议 : 在 客 
户 的 推动 下 ， 设 计 开 发 人 员 和 运 维 人 员 定 期 举行 技术 交流 ， 多 交流 硬件 、 数 据 库 、 中 间 件 以 
及 应 用 开发 中 遇 到 的 性 能 痛 点 ， 拿 出 一 套 行 之 有 效 的 办 法 在 当前 项 目 中 试点 并 在 其 他 项 目 中 
加 以 推广 。 


示 银 行 性 能 优化 的 真实 案例 


2012 年 12 月 15 日 , 星期 和 六， 早上 8 点 钟 ， 本 人 衣冠 楚楚 ， 匆匆 出 门 ， 打 算 去 参加 一 个 老 
同学 的 婚礼 。 刚 上 出 租车 ,就 接 到 了 公司 销售 的 电话 ,说 是 国内 某 银 行 客 户 的 DB2 数据 库 上 线 
试 运行 后 出 现 了 非常 严重 的 性 能 问题 ， 希 望 我 赶赴 浙江 字 波 现场 做 一 下 性 能 调 优 工作 。 前 儿 年 
如 果 周 末 接 到 这 种 电话 ， 我 内 心 肯定 会 抱 外 一 番 的 ， 周 末了 都 不 让 人 好 好 休息 ， 不 过 经 历 的 多 
了 也 束 适 应 了 ， 也 慢 慢 练 承 了 乱 云 飞 渡 仍 从 容 的 气度 。 老 同学 的 婚礼 该 参加 还 是 继续 参加 ， 该 
喝酒 还 是 继续 喝酒 ， 该 定 去 宁波 的 机 票 还 是 继续 定 。 

我 是 12 月 16 日 晚上 抵达 宁波 的 ， 到 了 之 后 和 客户 领导 郑 总 约 了 第 二 天 也 驶 是 12 月 17 日 
早上 9 点 在 现场 召开 会 议 。 

第 二 天 也 就 是 星期 一 上 午 8 点 50 分 ， 我 刚 到 了 客户 会 议 室 门口 ， 束 听见 一 个 人 在 满腔 怒 
火 地 训斥 ， 从 声音 可 以 听 出 来 这 个 训 人 者 就 是 昨天 和 我 通电 话 的 客户 领导 郑 总 。 等 我 刚 踏 入 会 
议 室 ， 发 现场 面 非常 隆重 ， 里 面 坐 了 很 多 人 ， 除 了 客户 领导 外 ， 还 有 客户 方 DBA 小 李 、 第 三 
方 顾 问 公司 的 架构 师 老 张 、 以 及 来 日 几 家 应 用 开发 商 的 大 队 开 发 人 员 ， 可 谓 各 路 天 聚 齐 果 一 笃 
呵 。 作 为 原 三 的 唯一 代表 ， 本 人 孤独 地 坐 在 了 角 洲 里 。 会 议 几 平 在 争吵 中 度 过 ， 下 面 是 我 对 大 
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家 发 言 概要 的 整理 。 

郑 总 发 言 : “这 个 项 目 是 银监会 重点 督导 的 项 目 ， 上 其 有 苗 要 的 政治 意义 ， 如 果 这 个 项 目 在 
宁波 试点 成 功 了 ， 那 么 可 以 推广 到 华东 其 至 是 全 国 。 但是， 开发 商 在 开发 阶段 就 屡次 拖延 工期 ， 
这 次 上 线 试 运行 后 ， 又 暴露 了 严重 的 性 能 问题 ， 业 务 人 员 没 法 使 用 ， 对 此 我 是 非常 不 满意 的 ， 
需要 拿 出 彻底 的 整改 办 法 来 。?” 

开发 商 代 表 发 言 : “首先 ， 接 受 领 导 的 批判 。 但 是 ， 这 个 项 目的 业务 需求 改动 了 好 几 次 ， 
另外 我 们 的 队伍 对 Weblogic 应 用 服务 器 和 Oracle 数据 库 非 常熟 悉 ， 但 是 对 DB2 数据 库 开 发 和 
优化 的 技术 积累 非常 注 弱 啊 ， 没 有 原 厂 的 支持 是 不 行 的 。” 

RARE: “原矿 的 工程 师 已 经 到 了 ， 王 工 ， 你 终于 出 山 了 ， 昨 天 从 北京 过 来 的 吧 ， 你 可 
是 DB2 领域 的 领军 人 物 了 ， 解 决 这 个 性 能 问题 可 以 说 是 淮 手 之 劳 啊 …… ” 

REA: “多 谢 大 家 的 信任 ， 初 来 乍 到 ， 我 先 了 解 一 下 情况 再 发 表 建 议 吧 。” 

客户 方 DBA 小 李 发 言 〈 发 言 非 常 激烈 ) : “这 个 应 用 上 线 试 运行 后 ， 正 常情 况 下 还 好 ， 
但 是 一 旦 达到 了 1000 并 发 用 户 时 ,系统 的 平均 啊 应 时 间 从 1s 一 下 急剧 增加 到 4s 左右 ,业务 人 
员 根 本 就 没 法 用 ， 要 知道 现在 的 便 件 可 是 16 内 核 的 双 机 Power 740 T! ” 

开发 商 代 表 接 看 发 言 (CARRI) : “现在 双 机 Power 740 配置 太 低 了 ， 难 以 满足 性 能 
直 要 ， 请 投 业 务 最 高 峰值 配置 便 件 资源 ， 使 用 最 高 档 Power 780， 为 外 存储 设备 也 要 升级 ， 用 
IBM V7000! " 

郑 总 发 言 : “这 算 什 么 回 事 ? 不 是 国庆 节 前 后 刚 从 x3850 升级 到 Power 740 吗 ， 当 时 你 们 
可 是 告诉 我 ，Power 740 肯定 够 用 了 ， 现 在 义 要 到 Power 780， 你 们 真 好 意思 说 出 口 ! ” 

开发 商 代 表 小 声 说 : “这 个 不 会 是 DB2 的 Bug 导致 的 吧 …… 

第 三 方 顾问 公司 的 架构 师 老 张 发 言 : “现在 是 双 机 Power 740， 一 全 运行 Weblogic 应 用 服 
务 器 ， 一 台 运 行 DB2， 使 用 HACMP 来 实现 HA， 当 出 现 故 障 时 ， 一 台 机 器 接管 另外 一 台 。 现 
fr DB2 有 新 的 技术 了 ， 可 以 用 DB2 pureScale 试 试 ， 如 果 还 不 行 的 话 ， 可 以 考虑 DB2 一 体 机 方 
3€ pureData， 应 用 跑 上 去 肯定 快 儿 倍 ! ” 

我 寻思 看 ， 首先 感谢 这 个 染 构 师 对 IBM 新 搁 术 新 产品 的 信任 ,不 过 他 也 有 点 太 看 急 了 , H 
前 是 响应 时 间 慢 的 问题 ， 不 是 事务 吞吐 量 遇 到 瓶颈 的 问题 ， 在 没有 真正 分 析 客 户 的 性 能 瓶颈 之 
前 ， 这 样 去 便 推 销 DB2 pureScale 或 者 pureData 一 体 机 ， 不 仅 不 会 给 客户 留 下 好 感 ， 有 时 候 反 
而 让 客户 对 这 些 新 技术 或 者 新 产品 产生 强烈 的 乾 反 心理 。 

会 开 到 这 个 份 上 ， 其 实 已 丝 隐 入 了 僵局 ， 我 坐 在 角 沙 里 ， 大 脑 里 反复 出 现 郑 总 的 话 ， 经 验 
告诉 我 ， 当 客户 遇 到 人 危难 独 夸 我 的 时 候 ， 其 实 已 经 把 我 推 到 了 风口 上 了 ， 因 为 终于 有 了 可 以 墙 
枪 眼 的 人 人 了。 当然 , 我 也 在 考虑 解决 办 法 ， 内 心 也 发 出 这 样 的 感慨 ; 相当 一 部 分 客户 和 开发 商 ， 
什么 都 敢 用 ， 但 是 都 用 的 不 够 专业 ， 不 够 精细 ， 这 样 一 旦 出 现 性 能 问题 时 ， 他 们 残 上 只 能 高 谈 政 
治 意义 ， 随 后 习惯 性 地 拍 脑 袋 做 决定 ， 很 难 冷 名 客观 地 分 析 问 题 和 解决 问题 。 

快 到 中 午 了 ， 郑 总 下 午 还 有 其 他 日 彰 安 排 ， 开 发 商 提出 的 用 最 高 档 Power 780 的 建议 即将 
锐 一 锤 定 首 的 时 候 ， 我 赶 坚 发言， 把 我 想 说 的 用 最 快 的 速度 说 了 出 去 : “首先 ， 我 认为 这 个 系 
统 目 前 不 应 使 用 Power 780 M IBM V7000 存储 ， 那 是 一 种 对 资源 的 浪费 ，Power 740 跑 这 样 的 
负载 年 综 有 余 ; HK, RUN DB2 还 有 优化 空间 ， 我 有 办 法 调整 一 些 参数 让 DB2 把 硬件 的 能 
力 发 挥 出 来 ; 最 后 ， 也 是 最 重要 的 ， 应 用 软件 还 有 很 大 优化 空间 ， 至 少 在 1000 并 发 用 户 的 情况 
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下 ， 响 应 速度 急剧 变 慢 ， 就 和 应 用 有 关 。” 

我 说 出 上 面 的 话 后 ， 整 个 会 议 室 突然 宁静 了 下 来 ， 开 发 商 的 人 员 面 面相 裔 ， 客 户 领导 这 时 
有 反而 笑 了 ， 笑 的 我 有 点 发 毛 ， 他 篇 的 问 我 “ 王 工 ， 你 有 几 成 把 握 ?” 这 个 项 目 可 是 非常 紧急 
的 ， 不 能 意气 用 事 啊 ”， 我 内 心 其 实 也 虚 不 过 还 是 表面 非常 镇 定 地 回答 : “立足 于 现 有 的 硬件 
环境 ， 请 给 我 5 天 时 间 吧 ， 当 我 优化 数据 库 和 改造 应 用 的 时 候 ， 请 DBA 和 开发 人 员 配 合 我 ， 
谢谢 ! ” 

可 能 是 外 来 的 和 尚 会 念经 吧 ， 另 外 我 估计 郑 总 以 前 就 被 那些 劝 他 升级 高 档 便 件 Power. 780 
的 人 吓 怕 了 了。 非常 出 人 意料 ， 喜欢 张嘴 加 人 的 郑 总 苋 然 采纳 了 我 的 建议 ， 也 对 我 提出 的 让 DBA 
和 开发 人 员 配 合 这 样 的 要 求全 部 满足 。 不 过 , 最 后 他 走出 会 议 室 的 时 候 ， 于 下 了 一 句 狠 话 给 我 : 
“我 现在 骂人 都 骂 累 了 ， 如 果 没 有 搞定 ， 就 走 人 吧 。” 

星期 一 : 应 用 自 下 而 上 方法 学 ， 制 定 优化 计划 
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下 午 的 时 候 ， 我 和 小 李 以 及 来 目 开 发 商 的 儿 个 开发 人 员 在 会 议 室 进行 了 深入 讨论 ， 确 定 优 
化 方法 和 实施 计划 。 开 发 人 员 刚 要 开始 给 我 评 细 介绍 应 用 好 辑 的 时 候 ， 我 立刻 拒绝 了 ， 现 在 没 
有 时 间 听 这 个 。 

其 实 ， 他 们 部 想 知 违 我 硼 户 里 卖 的 什么 药 ， 想 看 看 我 有 什么 办 法 解决 这 个 燃眉之急 。 我 内 
心 其 实 也 是 有 点 志 轰 的 ， 不 过 还 是 移 给 他 们 上 了 一 诛 : “性 能 优化 的 方法 有 两 种 : 目 上 而 下 方 
法 学 和 目下 而 上 方法 学 。 目 上 而 下 的 思路 是 早 发现 早 解决 ， 越 到 后 面 发 现 , 优化 的 成 本 丈 越 局 ， 
因为 它 是 员 穿 设计、 开发 和 维护 的 所 有 阶段 的 ， 不 过 目前 已 经 处 于 试 运行 阶段 ， 目 上 而 下 显然 
征 不 可 行 了 ， 所 以 只 能 采用 目下 而 上 方法 学 。” 

JE fü TE MEUS HET, WAHRSIEACHUFET  BüJERBOHAOREH PWET: “ 它 是 一 种 应 急 的 
办 法 ， 分 别 从 硬件 和 应 用 入 手 ， 人 硬件 上 通过 合理 配置 让 DB2 发 挥 便 件 最 大 能 力 ， 这 个 不 难 ， 我 
用 一 天 时 间 就 能 解决 好 。 比 较 费 蕊 的 是 应 用 优化 ， 第 一 ， 我 没有 时 间 了 解 应 用 地 辑 的 细 市 ， 当 务 
之 蕊 是 需要 化 时 间 把 最 影响 性 能 的 模块 找 出 来 ,再 从 这 个 模块 里 面 找 出 前 10 位 执行 时 间 最 长 、 执 
行 次 数 最 多 的 SQL 语句 ， 分 析 它 们 的 访问 计划 ， 随 后 运用 索引 、 表 连接 、 分 区 等 技术 有 效 解决 它 
们 ; 第 二 ， 在 开发 应 用 的 时 候 ， 开 发 人 员 对 DB2 的 锁 机 制 估计 考虑 的 不 周 ， 上 午 小 李 提 到 的 有 
1000 并 发 用 户 时 ,系统 响应 时 间 急 剧 增加 ， 这 个 很 可 能 和 锁 有 关 , 但 本 质 上 牵涉 到 应 用 代码 。” 

于 是 ， 大 家 一 起 制定 了 优化 计划 : 星期 二 ， 调 整 参数 ， 发 挥 便 件 的 处 理 能 力 ; 星期 三 ， 优 
化 执行 时 间 最 长 、 执 行 次 数 最 多 的 SQL 语句 ; 星期 四 和 星期 五 ， 从 应 用 角度 解决 锁 问 题 。 

星期 二 : 调整 参数 ， 发 挥 硬 件 处 理 能 


我 和 小 人 来 到 了 客户 机 房 ， 一 进 到 机 房 ， 让 我 大 吃 一 惊 。 作 为 一 名 当年 在 客户 现场 服务 的 
DB2 工程 师 ， 我 去 过 北上 广 很 多 大 客户 的 机 房 ， 包 括 最 大 电信 运营 商 的 和 最 大 银行 的 ， 这 个 客 
户 在 宁波 , 我 原 以 为 便 件 投入 上 比 不 上 北上 广 那 坚 客户 , 但 是 没 想 到 进去 后 , 全 是 清一色 的 BM 
Horas. HP REA LA EMC TERE A 100 $81. README SELA, HAA e iE 
FT, DRAR E RTR, KERER T o 

FHER, ZENE RAA HEREMAIA AERE, CPAT ENL DB2 数据 库 
和 Weblogic 应 用 服务 器 ， 所 以 ， 对 这 些 内 容 都 要 进行 性 能 监控 。 
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首先 监控 了 Weblogic 应 用 服务 器 的 运行 情况 。 主 机 的 CPU 和 内 存 利用 率 一 切 正 常 ， 这 个 
也 是 开发 商 的 强项 ， 他 们 对 Weblogic 非常 玖 入， 所 以 没有 问题 也 是 意料 之 中 的 事 。 

其 次 是 存储 规划 ,这 块 是 小 李 搭 建 的 ,一共 16 块 盘 , 每 块 盘 300GB 左右 , 划分 为 4 个 RAID 
组 ， 每 个 RAID 组 是 3D+1P， 其 中 两 个 RAID 组 存放 数据 ， 一 个 RAD 组 存放 索引 ， 最 后 一 个 
RAID 组 存放 事务 日 志 ， 这 是 一 种 教科 书 式 的 规划 。 我 通过 SSH 命令 登录 到 DB2 服务 器 上 ， 使 
用 dd 命令 对 每 个 RAID 组 的 WO 吞吐 能 力 进 行 了 测速 ， 可 以 达到 200 M/s 以上， 和 暂时 没有 调整 
的 必要 

dd if-/dev/zero of-/datal/test.file bs-8192 count-5000000 

5000000+0 records in 


5000000+0 records out 
40960000000 bytes (41 GB) copied, 179.411 seconds, 228 MB/s 


Aæ CPU 利用 率 。 在 1000 并 发 用 户 的 情况 下 ， 拥 有 16 个 内 核 的 Power 740 的 CPU 利 

用 率 也 就 是 20% 左 右 ， 显 然 是 足够 了 。 
最 后 是 监控 内 存 。 使 用 get snapshot 命令 抓 取 了 数据 库 快 照 和 应 用 快照 ， 发 现 缓冲 池 的 命 

中 率 竟 然 具 有 60%， 而 且 有 大 量 的 排序 溢出 和 编目 缓存 溢出 。 我 仔细 检查 了 一 下 ， 发 现 服务 吉 
总 的 物理 内 存 为 64GB， 平 时 可 用 内 存 大 约 48GB 左右 ， 但 是 发 现 DB2 仅仅 申请 了 28 内 存 ， 
HTZ, HTE GZTF mH WIRE! 把 这 么 多 内 存 空余 下 来 想 干 喻 ? 这 是 最 
大 的 浪费 啊 , 而 且 绥 冲 池 命中 率 这 么 低 。 想 想 也 觉得 这 没有 什么 奇怪 的 , 很 多 DBA 只 知道 DB2 
提供 的 STMM 内 存 自 调 优 ， 但 并 不 了 解 STMM 对 并 发 访问 量 非常 大 的 交易 系统 的 自 调整 有 一 
XE Bg Je, df HEAR EH —áEBJT He 

凭借 我 的 技术 和 经 验 ， 我 对 下 和 面 的 参数 进行 了 手工 调整 。 其 实 真 正 调整 的 就 是 下 和 面 儿 条 语 
人 句 ， 但 就 是 这 几 条 语句 ， 客 户 、 开 发 商 和 第 三 方 顾问 公司 要 求 我 写 书面 的 调整 建议 书 ， 随 后 反 
复评 估 了 整个 下 午 ， 先 在 测试 环境 验证 ， 最 后 我 和 小 至 在 晚上 负载 低 的 时 候 进 行 了 正式 实施 。 

调整 缓冲 池 大 小 , 将 DataBuf 设置 为 102400 个 页 面 ， 由 于 页 面 大 小 为 16K， 所 以 总 大 小 为 
16GB，IndexBuf ix & 7j 512000, Hl 8GB， 再 次 监控 ， 绥 冲 池 命 中 率 达 到 了 9996! 


--pagesize 为 16K 
ALTER BUFFERPOOL DataBuf IMMEDIATE size 1024000 
ALTER BUFFERPOOL IndexBuf IMMEDIATE size 512000 


增加 sortheap 大 小 直到 不 出 现 排序 洲 出 为 止 ， 最 终 调整 为 819200。 


update dom cfg using SHEAPTHRES O 
updare ao ctg using sheapthres_ shr 16368400 
update db cfg using sortheap 819200 


同样 的 办 法 ， 增 大 CATALOGCACHE SZ 直到 编目 缓存 不 出 现 洲 出 为 止 ， 最 终 调 整 为 
102400. 


update ao ctg using CATALOGCACHE SZ 102400 


同样 的 办 法 ， 增 大 PCKCACHESZ ARERANGI, mix Wd 102400. 


update db cfg using PCKCACHESZ 102400 
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星期 三 :优化 前 10 位 执行 时 间 最 长 、 执 行 次 数 最 多 的 SQL 语句 


这 一 大 是 我 过 的 最 开心 的 一 大， 也 是 最 顺利 的 一 天 。 早 上 刚 到 机 房 ， 小 李 束 把 昨 晚 的 对 比 
结果 发 出 来 了 : 经 过 参数 调整 后 ， 在 1000 并 发 用 户 的 情况 下 ， 系 统 的 啊 应 时 间 从 4s 减少 到 了 
28。 

接 下 来 按照 计划 开始 了 优化 SQL 语句 。 本 来 以 为 能 抓 住 什么 能 装 满 好 几 页 的 SQL 语句 ， 
假如 我 目 己 解决 不 了 的 话 ， 可 以 请 教 加 合 大 多 伦 多 实验 宇 的 SQL 专家 ,但 没 想到 我 从 
snapdyn sql 管理 视图 里 耐 抓 出 的 前 10 位 执行 时 间 最 长 的 SQL 语句 竟然 都 非常 简单 ， 但 是 执行 
次 数 非常 多 ， 达 到 了 上 亿 次 ! 

select TOTAL BXEC TIME, NUM EXECUTIONS, STMT TEXT from Svescem siens score. sal order 
by TOTAL EXEC TIME dese fetch tirst 10 rows only 

NUM EXECUTIONS TOTAL BXEC TIME STMT TEXT 

3292321 293118181 


SELECT ORDERID, ORDERTIME FROM BANK.ORDER WHERE ORDERNumber = ? AND ORDERTIME > ? 
ANDFORDERTIMER TR ORDER EY T ORDERMIMETDESE 


首先 来 看 第 1 条 执行 时 间 最 长 的 SQL 语句 。 这 个 SQL 语句 很 简单 ， 就 是 对 表 ORDER 上 
的 一 个 动态 查询 ,ORDER 这 个 表 有 3 亿 多 条 记录 , E RAT T 3292321 秒 , 执 行 了 293118181 
W! 

解决 办 法 是 什么 ? 其 实 很 简单 ， 为 这 条 语句 创建 如 下 索引 ， 这 样 不 用 再 对 ORDER 表 进 行 
表 扫 描 ， 可 以 通过 索引 扫描 取得 结 

CREATE INDEX "BANK"."IQUERY" ON "BANK"." ORDER" 

("ORDERNumber™ ASC, 
"ORDERTIME™ ASC) 


MINPCTUSED 10 
ALLOW REVERSE SCANS 


创建 完毕 后 ， 运 行 runstats 命令 ， 重 新 收集 统计 信息 ， 这 样 优 化 器 在 生成 访问 计划 的 时 候 
就 可 以 用 上 索引 了 。 

其 他 9 条 执行 时 间 最 长 的 SQL 语句 ， 也 是 通过 索引 技术 进行 了 优化 。 随 后 ， 我 整理 了 报告 
发 给 了 客户 、 开 发 商 和 第 三 方 顾 问 公 司 供 他 们 评估 使 用 。 很 快 ， 他 们 束 做 了 答复 ， 同 意 先 在 测 
试 环境 验 证 。 完 成 验证 后 ， 已 经 夜 深 入 前 了， 最 后 我 哆 看 咖啡 指导 小 李 在 生 产 库 上 进行 了 成 功 
实施 。 

星期 四 : 解决 锁 问 题 


早上 来 的 时 候 ， 路 上 堵车 ， 晚 到 了 20 分 钟 。 当 我 刚 到 机 房 门口 就 听见 郑 总 在 用 非常 洪亮 
的 声音 给 小 李 和 开发 商 的 开发 人 员 讲 话 。 他 刚 看 到 我 融 访 : ELC, KILAR TERRI T A I, 
听 小 李 说 ,现在 平均 啊 应 时 间 已 经 优化 到 1s 左右 了 ,看 样子 大 功 告 成 了 ,上 晚上 请 你 吃 宁 波 亲 ! ” 
看 样子 郑 总 的 心情 不 错 ， 但 是 ， 我 知道 还 有 优化 空间 ， 因 为 星期 二 调整 参数 的 时 候 发 现 了 
大 量 的 锁 等 每 。 和 任 价 我 的 经 验 ， 锁 问题 的 产生 通常 是 由 于 表 的 不 合理 设计 或 者 事务 对 表 的 不 合 
HEDFAN, AFEFE. RERA ENAR, HKRM EN, 
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我 再 加 把 劲 ， 看 看 能 个 再 提升 一 下 。 

于 是 ， 在 小 李 的 配合 下 ， 我 多 次 使 用 db2pd 工具 分 析 锁 ， 发 现在 高 并 发 的 情况 下 ， 应 用 会 
千 万 次 的 执行 同一 事务 逻辑 ， 即 查询 热 表 SALESDATA 中 的 某 一 行 ， 随 后 再 修改 这 个 热 表 中 的 
同样 的 行 ， 这 样 当 多 个 事务 争 抢 同一 行 时 ， 吏 会 出 现 大 量 的 锁 等 符 。 

通过 抓 取 应 用 快照 ， 发 现 这 些 同 一 事务 的 业务 逻辑 也 不 复杂 ， 就 是 两 条 SQL 语句 ， 都 是 对 
K SALESDATA 操作 的 ， 这 个 表 有 8000 万 左右 的 记录 数 。 


-- 开 始 事务 

业务 逻辑 代 但 . . . 

-- 对 表 SALESDATA 进行 查询 
SRIEBCTSRRRINVAITATIDNNDSDICSRRERIVAEBEPECODGARERVARHOEUDDAXSURCHARGESSNICSGHITAREIBVAE 
JXPOOBRESISCMPPEOQERCHCGUNINIERS VICINITY DEI PARTURECOUNTYIER; WORKS TATITLONT DENI I ELER PROM 
BMG DA ND NORND 

业务 逻辑 代 但 . . . 

-- 对 表 SALESDATA 进行 更 新 
UPDETROSBANKOUSADLBSDETAONSBEDCOABSBEVVATATIBENIDRE[D—CNBSEPIAEERERCODES—O 
ARRIVALHOLIDAYSURCHARGE = ?, NIGHTARRIVAL = ?, VICINITYAPPROACHCOUNTVER = ?, 
VACATE DEEA RURE COUN OROEN R E CD EN R 
EOICANDOSSCORITYPBIUIS 


ed 


过 到 这 种 情况 ， 只 能 和 开发 人 员 沟 通 一 下 了 。 开 发 人 员 告 诉 我 ， 这 是 业务 逻辑 的 要 求 ， 没 
有 办 法 修改 代码 的 ， 所 以 他 们 建议 调整 一 下 锁 有 关 的 参数 而 不 是 修改 代码 。 我 知道 这 么 做 ， 只 
是 治标 不 治本 ， 不 过 调整 也 能 取得 一 定 的 效 末 ， 也 残 答 应 了 。 

最 终 将 LOCKTIMEOUT 从 90 调整 为 30， 这 里 的 单位 是 秒 ，90 秒 的 时 间 太 长 了 ， 设 置 为 
30 秒 比 较 合 理 ， 这 样 锁 等 竺 超过 30 秒 后 ， 就 会 回 深 事务 并 报 锁 超时 ， 从 而 提升 事务 否 叶 量 。 


update do ctg using LOCKTIMEOQUT 30 


将 LOCKLIST Ñ X Jj 40960, MAXLOCK 调 大 为 60， 这 样 为 锁 分 配 更 多 的 内 存 资 源 。 


update db cfg using LOCKLIST 40960 
update db cfg using MAXLOCKS 60 


这 个 事务 的 频繁 执行 ,会 写 大 量 的 日 志 到 磁盘 上 上， 分别 增 大 了 日 志 绥 冲 区 (LOGBUFSZ) 、 
日 志文 件 大 小 LOGEFILSIZ ) 、 主 日 志文 件 个 数 CLOGPRIMARYO ) 和 辅助 日 志文 件 个 数 
(LOGSECOND) 。 


update db cfg using LOGBUFSZ 10240; 
update do cfg using LOGFILSIA 1024007 
update db cfg using LOGPRIMARY 50; 
update db cfg using LOGSECOND 30; 


晚上 ， 邓 总 开车 过 来 ， 融 看 我 、 小 全 和 几 个 开发 人 员 一 起 去 了 一 家 普 名 的 宁波 末 馆 。 由 于 
1s 的 平均 啊 应 时 间 已 经 达到 了 ， 所 以 大 家 也 比较 放松 ， 吃 的 不 错 ， 也 哆 了 酒 。 我 便 看 酒 功 ， 告 
诉 郑 总 ， 越 到 后 面 ， 调 优 的 成 本 越 局 ， 但 我 还 要 再 独 攻 一 下 ， 看 看 能 否 达到 0.9s 左右 ， 全 少 要 
把 锁 等 待 消灭 一 批 才 行 。 
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星期 五 : 应 用 改造 
早上 来 到 机 房 , 小 李 告 诉 我 ,昨天 对 锁 参 数 的 调整 效果 不 大 , 但 是 预定 的 目标 已 经 达到 了 ， 


这 个 时 候 停 下 来 客户 方 郑 总 是 可 以 接受 的 ， 不 过 我 可 不 能 这 样 吏 齐 率 放 奔 。 


Oracle 的 DBA 一 般 遇 到 问题 ， 第 一 时 间 想 到 的 是 Metalink 网 站 ， 对 DB2 来 说 就 是 信息 中 


心 了 。 我 到 DB2 信息 中 心 网 站 上 检索 了 一 下 ， 原 来 这 两 条 语句 是 这 样 加 锁 的 ， 在 当前 CS 隔离 
级 下 , 第 一 条 SELECT 语句 根据 where 条 件 获取 某 一 行 上 的 NS 锁 , 这 条 语句 可 以 立即 获得 NS 


锁 ， 


不 会 出 现 锁 等 待 ; 但 是 ， 第 二 条 update 语句 会 试图 将 该 行 上 的 NS 锁 升 级 为 和 锁 ， 这 个 时 


IRA WT Be c E BEST e 


-- 开 始 事务 

业务 逻辑 代码 ... 

--X]3é SALESDATA 进行 查询 

-- 这 条 select 语句 会 根据 where 字句 的 条 件 获 取 指 定 行 的 NS 锁 

SELECT VN DER 
VICINITYABRBBEROACHCOUNTVER, VICINITYDESEARTURECOUNTVER, WORKS TATTLTONTDENTIEILER PROM 
BANK.SALESDATA WHERE FLIGHTIDENTIFIER = ? AND RECORDTYPE = ? 

业务 逻辑 代码 ... 

--X]3é SALESDATA 进行 更 新 

一 这 条 update 语句 会 将 该 行 上 的 NS 锁 试 图 升级 为 X 锁 
UPIDETNOGBANREOSSATBSDETASREPCOARBRIUVATATIBENIBIDS—NBSERVATBIECODBES— 之 7 
AERERIMATHONIDAV SUROM REC PE MCNSEGHEAREREImAEE-P,BPRORPPEORCBSCONNISZBEM 

RN GN YD RE PRTRSDUBRRCOUNDIAREE—EIOmRSSIABqTMNSDSRIPSBEPRBERC—C? Gl EN 
= ? AND RECORDTYPE = ?> 


-o 


那么 有 什么 变通 的 共 法 呢 ? 根据 DB2 信息 中 心 的 提示 ,我 做 了 下 面 的 改动 , 第 一 条 SELECT 


语句 后 面 加 入 “with RS USE AND KEEP EXCLUSIVE LOCKS” 子 句 ， 这 样 可 以 直接 获取 指定 
行 上 的 义 锁 ,当然 这 个 时 候 也 会 出 现 一 定数 量 的 锁 等 等 ;等 到 update 语句 执行 的 时 候 ， 无需 从 
NS 锁 到 X 锁 的 转换 了 ， 也 就 不 会 再 出 现 锁 等 待 了 。 
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-- 开 始 事务 

业务 逻辑 代 但 . . . 

-- 对 表 SALESDATA 进行 查询 

-- 这 条 select 语句 会 根据 where 字句 的 条 件 直 接 获 取 指 定 行 的 x 锁 

SELECT ARRIVALATTENDED, ARRIVALFIRCODE, ARRIVALHOLIDAYSURCHARGE, NIGHTARRIVAL, 
VICINITYAPPROACHCOUNTVFR, VICINITYDEPARTURECOUNTVFR, WORKSTATIONIDENTIFIER FROM 
BANK.SALESDATA WHERE FLIGHTIDENTIFIER - ? AND RECORDTYPE = ? with RS USE AND KEEP 
EXCLUSIVE LOCKS 

WFR... 

--X K SALESDATA 进行 更 新 

-- 该 行 上 已 经 是 xX BET, AE NS 到 X 的 锁 转 换 了 

UPDATE BANK.SALESDATA SET ARRIVALATTENDED ~ ?, ARRIVALFIRCODE ~ ?, 
ARRIVALHOLIDAYSURCHARGE - ?, NIGHTARRIVAL - ?, VICINITYAPPROACHCOUNTVFR - ?, 
VICINITYDEPARTURECOUNTVFR - ?, WORKSTATIONIDENTIFIER = ? WHERE FLIGHTIDENTIFIER 
= ? AND RECORDTYPE = ? 


Bs 


狐 的 方案 是 侍 对 性 能 有 帮助 ， 只 有 经 过 测试 才 知 道 。 上 午 的 时 候 ， 我 把 报告 发 给 了 客户 和 
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开 肥 商 供 他 们 评估 。 尽 管 改 动 很 小 ， 由 于 目标 已 经 达到 ， 上 所 以 开发 商 的 态度 还 是 十 分 消极 的 ， 
不 太 愿 意 修 改 应 用 代码 。 不 过 还 好 ， 客 户 方 的 郑 总 尽管 不 情 技 术 细 节 ， 但 他 认可 这 个 办 法 ， 人 至 
少 生 可 以 试 试 的 。 

开发 商 化 了 30 分 钟 束 改 好 了 人 代码， 重新 部 车 到 Weblogic 应 用 服务 器 上 ， 随 后 在 测试 环境 
进行 了 验证 ， 取 得 了 不 错 的 效果 。 最 终 ， 星 期 五 的 晚上 ， 我 、 小 李 和 开发 人 员 一 起 在 生产 库 上 
进行 了 正式 实施 。 

实施 完毕 后 ， 已 经 晚上 8 点 多 了 ， 我 路 上 了 从 宁波 飞 往 北京 的 最 后 一 班 飞机 ， 心 中 安奈 有 目 
己 说 ， 全 少 效 来 不 会 更 坏 吧 。 到 了 星期 大， 小 字 打 电话 告诉 我 效果 : 锁 等 竺 数量 从 原来 的 儿 十 
万 个 减少 到 了 几 干 个， 平均 啊 应 时 间 达 到 了 0.9s! 
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本 书 介绍 的 DB2 设计 与 性 能 优化 方法 ， 基 本 上 都 需要 DBA 调整 系统 参数 ， 调 整 逻 辑 设计 
和 物理 设计 ， 解 决 锁 问 题 ， 定 位 SQL 语句 ， 分 析 其 访问 计划 ， 在 测试 环境 验证 ， 在 生产 环境 实 
施 ， 最 后 评估 结果 。 这 是 一 种 手工 优化 方式 ， 对 DBA 和 开发 人 员 有 一 定 的 技术 要 求 。 

从 V9.1 开始 ，DB2 提供 了 很 多 目 调 整 特 性 ， 例 如 目 动 存储 管理 C Automatic Storage) . 
自动 内 存 调 优 CSefl Tuning Memory Management) 、 自 适应 压缩 等 ， 另 外 还 提供 了 自动 监控 工 
H OPM (Optim Performance Manager) ， 目 动 SQL 语句 调 优 工具 (Optim Query Tuner? 、 目 动 
查询 负载 调 优 工具 (Optim Query Workload Tuner) ， 也 就 是 说 要 从 传统 的 手工 优化 时 代 进 入 自 
动 优 化 时 代 ! 

本 人 在 2010 年 参与 过 一 个 电信 行业 的 数据 仓库 项 目 ， 当 时 客户 方 的 DBA 要 求 在 项 目 中 使 
用 图 形 化 工具 。 AX HP BT] DB2 高 手 站 起 来 大 声 抗 议 : “图 形 化 工具 没 用 ，DB2 中 的 每 
条 命令 我 都 是 顺手 融 来 ! ”大 家 都 知道 ， 他 的 确 是 技术 精湛 的 蜗 手 ， 对 他 来 说 敲 命令 是 没有 任 
何 难度 的 。 当 然 ， 他 说 的 也 未 必 全 是 错 的 ， 他 可 以 在 一 些 对 安全 管理 非常 规范 的 客户 那 发 挥 关 
键 作 用 。 例 如 金融 证 券 业 客户 ， 一 般 不 允许 你 使 用 目 己 的 笔记 本 ， 你 只 能 使 用 客户 提供 的 客户 
闪 软 件 。 但 是 这 个 客户 应 可 能 什么 工具 都 没有 给 你 逆 ， 你 只 能 在 上 面 散 入 字符 。 这 种 情况 下 ， 
你 丈 必 须 放弃 图 形 界面 这 个 抛 杖 了 ， 离 开 拐 杖 ， 你 也 要 会 走路 啊 。 

但 是 ， 对 于 刚 接 触 DB2 的 新 手 来 说 ， 全 部 禹 命令 是 不 现实 的 ， 而 且 DB2 的 功能 越 来 越 多 ， 
在 使 用 上 只 徘 禹 命令 很 难保 证 工作 效率 和 项 目 进度 的 要 求 。 所 以 ， 在 为 允许 使 用 图 形 化 工具 的 
客户 服务 时 ， 可 以 尽量 使 用 工具 以 提高 工作 效率 。 

言 归 正 传 ， 那 么 从 手工 优化 进入 到 目 动 优化 时 代 ，DBA 真 的 要 失业 了 吗 ? 我 认为 , ÆA 
优化 时 代 , DB2 提供 的 自 调 整 特性 以 及 一 些 SQL 目 动 优化 工具 仍然 无 法 代替 设计 人 员 、 开 发 人 
员 和 DBA 更 证 有 创造 力 的 工作 。DB2 提供 的 目 调 整 工具 是 需要 人 去 运用 的 ，SQL 语句 的 优化 
和 闻 务 浊 辑 是 强 关 联 的 ， 是 需要 和 设计 开 有 人员 认真 沟通 的 ， 目 动 化 工具 不 可 能 知道 广大 设计 
FREA da p fer A5 IE e 

笔者 认为 ， 在 目 动 优 化 时 代 ，DBA 的 作用 将 更 加 盏 要 。 这 些 上 自动 化 特性 或 者 工具 的 目的 只 
是 帮助 DBA 从 天 碎 的 事务 性 工作 中 解 及 出 来 ， 这样 DBA 可 以 集中 精力 放 在 数据 库 架 构 、 数 据 
模型 设计 、 应 用 开发 指导 、 运 维 规范 、 优 化 指 丙 等 更 需要 智 意 的 地 方 。 
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本 书 内 容 


本 书 内 容 严 谍 精 细 、 和 生动 活 浅 ， 从 内 容 来 看 ， 共 分 为 四 大 部 分 ，11 间 。 第 一 部 分 包括 第 1 
章 和 第 2 章 ， 提 出 了 两 种 性 能 优化 方法 学 ， 包 括 理想 化 的 自 上 而 下 方法 学 和 救急 专用 的 自 下 而 上 
方法 学 ， 随 后 通过 一 个 真实 的 实战 和 案例， 前 述 了 如 何 灵 活 运 用 方法 学 。 第 二 部 分 是 设计 部 分 ， 包 
括 第 3 章 ~ 第 $ 章 ， 分 别 谈 到 了 物理 设计 、 基 础 逻辑 设计 和 高 级 逻辑 设计 ， 这 是 设计 一 个 高 质量 
的 数据 库 系 统 所 必须 掌握 的 内 容 。 第 三 部 分 是 性 能 优化 部 分 ， 包 括 第 6 章 ~ 第 9 章 ， 讲 述 了 如 何 
对 DB2 进行 性 能 监控 ， 如 何 调整 参数 和 优化 维护 工具 ， 如 何 调整 锁 和 日 志 来 优化 高 并 发 系统 ， 
如 何 来 优化 最 耗资 源 的 SQL 语句 。 第 四 部 分 是 有 关 高 级 设计 与 优化 内 容 ， 包 括 第 10 章 和 第 11 
瘟 ， 讲 述 了 如 何 设计 和 优化 大 容量 数据 仓库 ， 讲 述 了 如 何 设计 和 优化 DB2 pureScale 集群 。 

为 了 方便 读者 ， 我 们 在 书 中 加 入 了 “注意 ”、“ 小 技巧 ”和 “比较 ”这 样 的 提示 性 文字 。 
其 中 “注意 ”的 内 容 是 需要 DBA 在 工作 中 重点 留意 的 ;， “小 技巧 ”的 内 容 是 我 们 重点 向 读者 
分 享 的 实战 技巧 ; “比较 ”的 内 容 是 一 些 容易 混淆 的 概念 ， 是 向 广大 DBA 和 开发 人 员 解 释 和 


最 后 ， 我 们 在 文中 的 一 些 脚本 片段 ， 采 用 灰 底 形式 ， 这 样 束 非常 明显 的 和 正文 区 别 开 了 ， 
同时 加 黑 处 理 了 脚本 中 的 一 些 重 点 内 容 以 示 强 调 。 
本 书 读者 

本 书目 标 读者 群 主 要 针对 数据 库 管 理 员 和 应 用 设计 开发 人 员 : 

(1) 数据 库 管 理 员 : 中 国 的 数据 库 管 理 员 非常 勒 备 ， 非 第 能 吃 吾 ， 对 AIX, Linux 等 操作 
系统 掌握 有 的 很 不 错 ， 对 DB2 的 安装 配置 也 都 没 问 题 ， 这 是 他 们 的 强项 。 但 是 到 了 运 维 阶段 过 到 
VERE IRISH Ber dex I. WEE "Efe dT: 从 网 上 搜 点 没有 经 过 验证 的 性 能 优 
化 秘籍 ， 残 敢 在 生产 系统 上 直接 实施 ， 成 功 了 是 运气 好 ， 失 败 了 算 目 己 倒 毒 。 另 外 ， 我 也 见 过 
很 多 数据 库 管 理 员 ， 不 了 解 应 用 的 设计 和 开发 ， 丝 坚 不 关 注 SQL 语句 背后 的 业务 逻辑 ， 这 说 明 
还 缺乏 目 上 而 下 方法 学 的 票 陶 。 因 此 , 这 本 IBM Jg) 的 性 能 优化 专车 将 会 帮助 您 们 掌握 原 广 正 
规 军 ”的 战略 战术 。 

(2) 设计 开发 人 员 : 目前 设计 开发 人 员 的 主力 都 是 80 后 和 90 JG f. AVE ER, fth 
们 中 的 很 多 人 已 经 开始 承担 核心 应 用 的 开发 了 了， 我 非常 理解 由 于 用 户 需求 的 频 索 变更 ， 让 开发 

员 苦 不 堪 言 ， 所 以 没有 时 间或 者 不 屑 去 关注 SQL 语句 的 数据 库 运 行 环境 ,可 能 认为 上 只要 掌握 
好 Select. Insert. Update 和 Delete 这 4 条 SQL 语句 就 可 以 打通 天 下 无 敌手 了 ， 但 是 我 想 说 的 
是 , DB2 是 IBM 公司 数 以 干 计 的 工程 师 历经 儿 十 年 打造 的 关系 数据 库 精 品 , 里面 的 技术 含量 很 
高 ， 不 是 为 了 仪 仪 文 持 那 4 条 SQL 语句 的 ! 我 建议 设计 开发 人 员 在 党 忙 的 设计 开发 工作 之 余 ， 
阅读 一 下 本 书 ， 这 本 书 将 会 从 应 用 的 角度 帮助 您 芮 正 擎 握 DB2 设计 与 性 能 优化 技术 , 读 后 一 定 
RAAME, WR. 
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我 们 经 常 遇 到 这 样 的 情况 : 数据 库 应 用 系统 上 线 运行 一 段 时 间 后 ， 就 会 出 现 性 能 问题 ， 例 
如 处 理 相 同 的 查询 比 刚 上 线 要 长 很 多 ， 在 业务 繁忙 时 事务 否 吐 量 无 法 满足 实际 需要 ， 有 了 时候 严 
重 的 性 能 问题 甚至 导致 数据 库 宕 机 。 往 往 在 这 个 时 候 ， 客 户 才 意识 到 ， 在 设计 开发 阶段 ， 数 据 
库 系 统 的 性 能 需求 没有 得 到 应 有 的 重视 。 

当 出 现 这 样 的 性 能 问题 时 ， 有 的 DBA 在 慌乱 之 中 对 数据 库 进行 盲目 的 参数 调整 ， 这 可 能 
让 情况 更 加 糟糕 ; 也 有 的 DBA， 要 求 将 运行 数据 库 的 现 有 硬件 人 符 换 成 高 档 硬 件 ， 这 很 可 能 
种 资源 的 浪费 ， 因 为 有 时 候 即 使 换 了 高 档 硬 件 ， 性 能 问题 还 是 依旧 存在 。 

归根 结 底 ， 他 们 急需 一 种 满足 实战 要 求 的 性 能 优化 方法 学 。 


EJ 
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1.1 什么 定性 能 问题 


从 大 的 方面 来 看 ， 性 能 问题 往往 分 为 两 大 类 : 影响 了 整个 系统 的 问题 和 影响 了 部 分 应 用 的 
问题 。 影 响 了 整个 系统 的 问题 ， 例 如 整个 系统 的 IO 瓶颈 :影响 了 部 分 应 用 的 情况 ， 例 如 某 一 
特定 应 用 或 SQL 语句 。 

性 能 问题 比 功 能 性 问题 难 解决 ， 最 首要 的 原因 在 于 ， 人 性 能 问题 往往 是 断断续续 发 生 的 ， 不 
容易 监控 和 捕捉 。 其 次 ， 根 据 症 状 不 容易 找到 问题 的 真正 根源 。 例 如 有 时 候 发 现 数据 库 系 统 有 
大 量 的 锁 超时 症状 ， 真正 根源 却 不 是 锁 的 问题 ， 而 是 由 于 过 时 的 统计 信息 导致 优化 器 选择 了 非 
最 优 的 访问 计划 导致 的 ， 这 对 DBA 来 说 往往 是 很 难 定位 的 。 

本 节 将 首先 探讨 如 何 发 现 系 统 的 性 能 问题 ， 随 后 讲述 衡量 性 能 的 关键 指标 ， 如 何 进行 性 能 
基准 测试 ， 最 后 探讨 如 何 制定 优化 目标 。 


1.1.1 如 何故 现 性 能 问题 


性 能 问题 的 背后 实际 上 是 业务 驱动 的 。 所 以 ， 可 以 从 业务 角度 确定 问题 ， 设 定 每 个 问题 的 
优化 目标 ， 设 定 每 个 问题 的 优先 级 ， 随 后 从 系统 角度 确定 原因 ， 弄 清楚 时 间 花 在 何 处 ;资源 是 
如 何 被 消耗 的 。 

具体 来 说 ， 可 以 先 从 下 面 的 问题 入 手 ， 来 判断 系统 是 否 存 在 性 能 问题 。 

(1) 是 否 有 性 能 降低 ， 与 什么 相关 ? “基准 ”是 什么 ? 

(2) 一 个 系统 的 性 能 看 起 来 在 随时 间 流 逝 下 降 了 ? 还 是 不 同 的 系统 性 能 比较 ， 发 现 有 一 
TRAEN TET? 

(3) 性 能 下 降 是 什么 时 候 发 生 的 ? 与 人 菏 个 工作 负载 的 运行 相关 吗 ? 性 能 下 降 周期 性 地 发 
^E R3 7 

(4) 性 能 下 降 的 前 后 系统 有 什么 变化 吗 ? 例如 座 加 了 痢 便 件 、 或 应 用 程序 被 更 改 了 、 大 
量 数据 被 加 载 、 或 者 更 多 的 用 户 访 问 这 个 系统 ? 

C55 能 不 能 器 数据库 管理 员 、 应 用 程序 开 有 友人 员 以 及 架构 师 多 了 解 一 些 业 务 和 系统 情况 ? 
因为 DB2 服务 器 几乎 总 是 便 件 、 中 间 件 和 应 用 程序 这 样 复 杂 环 境 的 一 部 分 。 

1.1.2. 衡量 性 能 的 天 键 指标 

一 个 系统 的 资源 例如 存储 、CPU 和 内 存 等 越 多 ， 资 源 被 调度 的 越 有 效 ， 能 处 理 的 负载 就 越 
大 。 换 句 话说 ， 性 能 受 两 个 关键 因素 的 有 影响。 其 一 是 系统 可 用 资源 ， 其 二 是 这 些 资源 是 如 何 被 
使 用 和 共享 的 。 

从 量化 指标 来 看 ， 性 能 的 好 坏 可 以 从 以 下 三 方面 来 衡量 : 

C1) 啊 应 时 间 : 应 用 辐 数 据 库 服务 器 发 起 请 求 ， 服 务 器 完成 处 理 并 返回 结 末 给 应 用 ， 中 
间 上 总 共 消 耗 的 时 间 ， 它 反映 了 数据 库 服务 右 的 处 理 速度 。 

(2) 事务 存 吐 量 : 通常 用 每 分 钟 处 理 的 事务 数 “TPM) 或 者 每 秒 钟 处 理 的 事务 数 CTPS) 
来 计算 ， 这 个 指标 反映 了 系统 的 事务 处 理 能 

(3) 资源 利用 率 : 数据 库 服务 硕 在 处 理事 务 或 者 得 询 的 过 程 中 ， 系 统 资源 包括 CPU. I/O 
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以 及 磁盘 的 使 用 情况 ， 这 个 指标 反映 了 系统 资源 是 否 被 有 效 利 用 。 

1.1.3 ”性 能 基准 测试 

制定 性 能 优化 目标 之 前 ， 首 先 需 要 对 系统 做 基准 测试 (Benchmark Test, BJ BMT) > AMÈ 
测试 是 一 种 测量 和 评估 软件 性 能 指标 的 活动 ， 它 通过 科学 的 测试 方法 、 测 试 工具 和 测试 系统 ， 
实现 对 某 项 性 能 指标 进行 定量 和 可 对 比 的 测试 。 

基准 测试 能 帮助 用 户 理解 数据 库 在 不 同 条 件 下 的 性 能 情况 。 例 如 通过 基准 测试 建立 一 个 已 
知 的 性 能 水 平 〈 称 为 基准 线 ) ， 当 系统 的 软 便 件 环境 发 生变 化 之 后 再 进行 一 次 基准 测试 以 确定 
那些 变化 对 性 能 的 影响 ， 这 是 基准 测试 最 常见 的 用 途 。 

基准 测试 的 时 机 很 多 ， 可 能 是 数据 库 配 置 参 数 更 改 ， 也 可 以 是 应 用 部 芽 发 现 变 化 ， 或 者 是 
数据 版 本 升级 了 。 这 个 时 候 可 以 将 再 次 测试 的 性 能 值 和 变化 前 进行 对 比 ， 并 做 定量 分 析 以 确认 
性 能 变化 情况 。 例 如 在 开发 阶段 ， 使 用 基准 测试 来 确定 应 用 程序 是 否 出 现 性 能 倒退 ; 在 运 维 阶 
段 ， 使 用 基准 测试 来 对 调 优 前 后 的 结果 进行 对 比 。 


Aa 注意 : 基准 测试 不 仅仅 是 DBA 的 


基准 测试 是 数据 库 应 用 生命 周期 的 一 部 分 ， 不 仅 需要 DBA 的 参与 ， 也 需要 设计 人 
员 和 应 用 开发 人 员 的 积极 参与 和 配合 . 
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1.4.4 制定 优化 目标 


制定 性 能 优化 目标 的 关键 在 于 量化 。 不 论 是 整个 系统 的 问题 ， 还 是 上 只 影响 了 部 分 应 用 的 问 
题 , 首先 都 要 确定 啊 应 时 间 能 比 基 准 值 减 少 多 少 , 其 次 要 确定 事务 否 吐 量 能 比 基 准 值 提升 多 少 。 

根据 系统 性 能 的 基准 值 以 及 系统 现状 ， 束 可 以 灵活 制定 性 能 优化 目标 了 ， 比 如 : 

(1) 现 有 系统 性 或 者 部 分 应 用 存在 性 能 问题 ， 制 定 优 化 目标 。 例 如 要 求 系统 优化 后 ， 响 
应 时 间 要 比 基 准 值 减少 20%， 事 务 否 吐 量 则 要 在 基准 值 的 基础 上 增加 20% 以 上 。 

(2) 现 有 系统 或 者 部 分 应 用 发 生 大 的 变更 后 ， 制 定 优化 目标 。 例 如 新 上 线 了 一 个 模块 ， 
系统 的 负载 变 重 ， 但 是 人 硬件 资 源 没 有 发 生变 化 ， 这 时 的 性 能 目标 可 以 定义 为 : 新 模块 上 线 后 响 
应 时 间 要 和 基准 值 相似 ， 可 接受 的 幅度 在 5% 左右 ， 但 是 总 的 事务 否 吐 量 要 求 在 基准 值 的 基础 
上 增加 20%。 

(3) 对 现 有 系统 或 者 部 分 应 用 进行 优化 ， 到 了 一 定 阶段 后 ， 制 定 后 续 目 标 。 例 如 ， 目 前 
性 能 已 经 达到 基准 值 的 130% 了， 考虑 到 边际 效应 ， 以 后 的 优化 上 只 能 产生 越 来 越 少 的 效益 。 优 
化 无 止境 ， 当 DBA 考虑 需要 多 少时 间 和 人 金钱 用 于 性 能 优化 时 ， 要 评估 一 下 所 花费 的 时 间 成 本 
和 人 金钱 成 本 。 


` ^t E 4 一 人 DEA 
l ~ 
1.2 (EBER 3 EF 
我 和 很 多 DBA 交流 过 ， 有 些 人 认为 性 能 优化 很 高 深 ， 需 要 了 解 DB2 的 配置 参数 、 锁 、 交 
易 日 志 等 技术 细节 ， 通 常 持 有 这 种 观点 的 人 都 是 数据 库 高 手 ， 而 且 他 们 也 以 掌握 了 这 些 细节 而 
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自豪 。 
真实 情况 是 ， 性 能 优化 没有 那么 神秘 ， 未 必 一 定 要 掌握 那么 深入 的 技术 细节 。 大 家 知道 ， 
性 能 问题 的 解决 是 找到 瓶颈 和 解决 瓶颈 的 过 程 ， 只 要 在 应 用 层 和 数据 库 层 找到 了 真正 的 瓶颈 ， 
随后 使 用 正确 的 方法 学 加 以 优化 ， 不 用 完全 掌握 那些 技术 细节 ， 也 能 有 效 地 解决 问题 。 
本 节 首 先 谈 谈 几 种 常见 的 性 能 优化 误区 ， 随 后 探讨 一 下 两 种 性 能 优化 方法 学 ， 即 自 上 而 下 
方法 学 和 自 下 而 上 方法 学 ， 最 后 阐述 如 何在 性 能 优化 时 灵活 选择 它们 。 
1.2.1. JLRS ILIR X 
如 果 没 有 掌握 正确 的 方法 学 ， 在 实际 生产 环境 中 定位 和 解决 性 能 问题 不 是 一 件 容易 的 事 。 
我 们 接触 了 很 多 客户 ， 在 性 能 优化 时 存在 下 面 三 种 典型 的 误区 。 
(1) 性 能 优化 可 以 通过 参数 调整 来 解决 所 有 问题 
客户 通常 都 热切 希望 不 要 动 他 们 的 硬件 和 应 用 ，DB2 有 什么 内 部 参数 调整 一 下 ， 就 可 以 解 
决 所 有 的 性 能 问题 。 这 种 观点 是 不 正确 的 ， 数 据 库 参 数 要 调整 ， 但 即使 调整 好 了 也 并 不 能 保证 
解决 所 有 的 性 能 问题 。 
(2) 性 能 优化 是 DBA 的 工作 ， 不 需要 设计 人 员 和 开发 人 员 参 与 
这 个 观点 认为 ， 在 项 目 进行 当中 ， 设 计 人 员 只 关注 数据 模型 ， 不 用 关心 逻辑 设计 和 物理 设 
计 ; 开发 人 员 只 关注 业务 功能 , 不 用 关心 SQL 语句 的 性 能 问题 。 但 是 , 这 种 观点 是 十 分 错误 的 ， 
大 多 数 系统 的 性 能 问题 还 是 由 于 设计 和 应 用 导致 的 ， 所 以 在 优化 工作 中 ， 需 要 设计 人 员 和 开发 
人 员 的 积极 参与 。 
(3) 用 更 快 的 硬件 可 以 解决 所 有 的 性 能 问题 
持 有 这 种 观点 的 人 很 多 ， 他 们 认为 出 现 性 能 问题 后 ， 用 更 快 的 CPU、 更 多 的 内 存 和 更 快 的 
IO 设备 就 能 解决 。 但 是 ， 这 种 说 法 是 不 全 面 的 ， 例 如 对 于 锁 问 题 造 成 的 懒惰 系统 ， 增 加 硬件 
资源 是 不 能 解决 的 。 实 际 上 ， 需 要 找到 性 能 问题 的 真正 原因 ， 再 采取 恰当 的 措施 。 
A 注意 : 什么 时 候选 择 硬件 扩容 ? 
如 果 确 认 系统 在 应 用 或 者 数据 库 层 面 已 经 没有 优化 空间 了 ， 这 时 可 以 考虑 硬件 扩容 
的 方式 。 例 如 针对 性 地 增加 存储 ， 使 用 更 快 的 CPU、 更 多 的 内 存 、 更 快 的 网 络 连 接 ， 或 
者 上 面 三 者 的 组 合 。 


1.2.2 自 上 而 下 (From Top To Down) 方法 学 


一 个 系统 进入 正式 运 维 阶段 前 ， 通 常会 经 历 设 计 、 开 发 和 上 线 等 阶段 ， 自 上 而 下 方法 学 是 
一 种 理想 的 方法 论 ， 要求 在 各 个 阶段 不 仪 要 考虑 业务 功能 的 实现 , 而 且 要 同时 考虑 性 能 。 例 如， 
在 设计 阶段 考虑 数据 库 逻 辑 设 计 、 数 据 库 物 理 设 计 、 应 用 设计 等 ; 在 开发 阶段 ， 考 上 处 如 何 编写 
AHI SQL 语句 ， 如 何 减少 死 锁 每 ， 在 上 线 阶 段 ， 考 虑 内 存 和 CPU 的 优化 ， 考 碟 磁 盘 IO X 
计 和 调整 等 。 

下 面 几 点 也 是 自 上 而 下 方法 学 重点 强调 的 : 

(1) 优化 工作 一 定 要 贯彻 始终 ， 越 早 越 好 ， 因 为 开始 的 越 早 ， 其 付出 的 成 本 也 就 越 小 。 

(2) 系统 上 线 前 ， 应 尽 可 能 的 解决 好 所 有 的 性 能 问题 ， 否 则 上 线 后 出 现 问题 ， 往 往 是 灾 
难 性 的 。 
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(3) 设计 和 开发 人 员 需 要 认真 对 竺 设计 和 开发 阶段 的 性 能 问题 ， 不 能 完全 依靠 性 能 更 强 
的 便 件 解决。 


1.2.3 自 下 而 上 (From Down To Top) 方法 学 


与 目 上 而 下 不 同 ， 目 下 而 上 方法 学 是 从 使 件 和 操作 系统 开始 ， 接 看 是 数据 库 ， 随 后 是 应 用 
服务 器， 再 到 应 用 这 样 的 顺序 去 诊断 问题 ， 根 本 目标 是 找到 性 能 瓶颈 。 很 多 DBA 都 有 这 样 的 
感觉 ， 当 出 现 性 能 问题 时 ， 找 设计 和 开发 人 员 帮 助 ， 有 时 候 很 难 ， 因 为 这 些 人 在 正式 上 线 后 大 
部 分 已 经 退出 项 目 组 了 ， 但 是 找 系 统管 理 员 和 网 络 管理 员 帮 助 是 非常 容易 的 ， 在 大 部 分 单位 都 
可 以 做 到 。 所 以 ， 这 种 方法 学 对 DBA 来 说 容易 上 手 ， 其 难点 在 于 找 性 能 瓶颈 的 过 程 。 

该 方法 学 在 解决 性 能 问题 时 ， 共 分 为 四 步 : 

(1) 第 一 步 ， 回 题 监控 弄 消 楚 系 统 的 整体 运行 情况 ， 包 括 便 件 、 操 作 和 系统、 数据 库 、 
中 间 件 和 业务 ， 确 定性 能 瓶颈 到 辰 在 哪 一 个 层面 。 

(2) 第 二 步 ， 参 数 调整 : 找到 性 能 瓶 祷 后 ， 如 宁 发 现 可 以 通过 参数 调整 来 解决 ， 那 么 优 
先 通 过 参数 调整 来 低 成 本 地 解决 问题 , 通常 这 些 参数 包括 便 件 参数 、 操 作 系 统 参 数 、DB2 参数 、 
中 间 件 参数 等 。 

(3) 第 三 步 ， 数 据 库 优 化 : 如 条 性 能 瓶 饭 在 数据 库 层 和 面 ， 并 且 参 数 调 整 无 法 解决 问题 ， 
这 时 束 要 根据 具体 的 瓶 贷 种 类 进行 姑 活 处 理 ， 具 体 的 处 理 办 法 见 本 半 1.4 78. 

(4) 第 四 步 ， 性 能 验证 : 优化 完毕 后 ， 将 优化 指标 和 优化 前 的 基准 值 进行 对 比 ， 没 有 必 
要 万 面 追求 最 局 性 能 ， 上 只 要 当前 性 能 指标 请 足 应 用 的 真正 需要 即 可 。 


1.224 目 上 而 下 和 目下 而 上 ， 如 何 选 择 ? 


从 技术 上 来 看 ， 这 两 个 方法 学 的 目的 部 是 为 了 解决 性 能 问题 ， 只 是 顺序 人 不同 ， 一 个 是 目 上 
而 下 ， 一 个 是 目下 而 上 。 上 自 上 而 下 是 理想 的 方法 ， 目 下 而 上 通常 是 不 得 已 而 为 之 。 如 果 多 用 目 
上 而 下 ， 需 要 救火 的 情况 了 就 会 少 ， 否 则 不 可 避免 地 要 会 采用 目下 而 上 的 方法 来 救火 。 不 过 ， 在 
有 基体 的 项 目 中 ， 技 术 角 度 只 是 考 碟 的 一 个 层面 ， 往 往 要 根据 实际 情况 进行 选择 和 取 人 铭 。 

CIO 如 末 是 一 个 新 系统 ， 那 么 可 以 采用 目 上 而 下 的 方式 ， 在 设计 、 开 友和 运行 维护 的 各 
个 阶段 不 仅 考 夸 功能 实现 ， 也 要 考虑 性 能 问题 。 

(2) 如 果 是 系统 已 经 上 线 并 且 运 行 一 段 时 间 了 ， 性 能 问题 变 得 严重 后 才 被 和 关注， 这 个 时 
人 各 其 实 残 是 一 个 现场 救火 了 ， 采用 目 上 而 下 几乎 是 不 可 能 的 ， 客 户 没 有 时 间或 者 也 不 可 能 把 设 
计 、 开 发 和 上 线 情况 说 清楚 ， 所 以 只 能 采用 目下 而 上 方法 学 。 

(3) 有 时 候 , 当 优 化 人 员 参 与 一 个 迭代 式 项 目的 时 候 , 不 同 模块 处 于 不 同 的 生命 周期 。 例 
如 有 的 模块 也 许 刚 进入 设计 和 开发 阶段 ， 这 个 时 候 适 合 采用 目 上 而 下 方法 学 ;但 是 有 的 模块 已 
经 过 了 设计 和 开发 阶段 了 ， 进 入 上 线 试 运行 阶段 了 ， 这 个 时 候 只 能 采用 目下 而 上 方法 学 。 


一 ES x SJal > 
1.3 ”高 质量 数据 库 设 计 
如 果 要 建设 一 个 新 的 数据 库 系 统 ， 那 么 必然 会 经 历 设 计 、 开 发 和 维护 的 各 个 阶段 ， 按 照 日 
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上 而 下 方法 学 ， 在 考虑 业务 功能 实现 的 同时 ， 人 性 能 优化 应 贯彻 始终 ， 越 早 越 好 ， 因 为 开始 的 越 
早 ， 其 付出 的 成 本 也 就 越 小 。 
本 小 节 将 按照 自 上 而 下 方法 学 的 实践 方法 , 深入 探讨 一 下 如 何 进行 高 质量 的 数据 库 设 计 。 
A 注 意 : 自 上 而 下 方法 学 施行 起 来 不 容易 
自 上 而 下 方法 学 是 性 能 优化 理论 上 最 好 的 方法 ， 它 要 求 在 设计 、 开 发 和 维护 的 各 个 
阶段 都 要 重视 性 能 问题 ， 在 这 种 方法 学 指导 下 实施 的 数据 库 通 第 性 能 较 高 ， 而 且 在 运 维 
阶段 出 现 性 能 问题 的 概率 要 小 很 多 。 
但 是 ， 这 种 方法 学 施行 起 来 不 容易 ， 它 需要 设计 人 员 、 开 发 人 员 和 DBA 的 通力 协 
作 。 现 实 中 ， 设 计 人 员 往 往 只 关注 数据 模型 ; 开发 人 员 往 往 只 关注 业务 功能 的 实现 ; 到 
TE a DBA VS AESCK T. 


先 看 一 下 数据 库 的 设计 过 程 ， 如 图 1-1 所 示 。 首 先 需要 以 用 户 的 眼光 来 看 待 现实 世界 的 业 
务 ， 做 到 真正 理解 客户 的 业务 需求 ， 这 就 是 通常 所 说 的 收集 需求 阶段 ， 随 后 业务 人 员 根 据 业务 
需求 设计 概念 模型 ， 并 且 该 模型 需要 和 现实 世界 相对 应 ， 这 就 是 概念 模型 设计 阶段 ， 接 着 进入 
逻辑 结构 设计 阶段 ， 在 这 个 阶段 数据 库 设计 人 员 使 用 业务 人 员 的 概念 设计 结果 ， 将 其 转换 为 具 
体 数 据 库 的 对 象 结构 ， 例 如 表 、 视 图 等 ， 然 后 是 物理 结构 设计 阶段 ， 需 要 为 逻辑 模型 选取 一 个 
最 适合 的 物理 环境 。 

设计 完成 后 , 就 进入 开发 
阶段 了 ， 这 个 阶段 DBA 会 将 
前 面 物理 设计 的 结果 部 署 到 
目标 机 器 上 , 开发 人 员 开 始 编 。 e n 
写 应 用 代码 去 实现 业务 逻辑 ， Modelofsystem 


in client's mind 


经 过 测试 后 准备 上 线 ; 最 后 是 现实 世界 


AAA TRE SR 


Entity model of 


x4 UtinERER SANA EL -I-GWE client's model 
dii E — 
是 上 线 后 的 H y UT. 维护 和 Table model of 
优 化 工作 . entity model 
数据 远 辑 模型 

本 W 将 从 H Jie 而 下 优 化 Tables on disk 
方法 学 的 思路 出 发 , 谈 谈 在 各 NISUS M 
个 阶段 需要 特别 注意 的 重要 图 1-1 数据 库 设计 的 一 系列 阶段 


事项 。 
1.3.1. 充分 了 解 需求 


这 个 阶段 的 目标 是 准确 了 解 用 户 的 需求 ， 它 是 整个 数据 库 设 计 过 程 的 基础 ， 也 是 最 困难 、 
最 耗费 时 间 的 第 一 步 。 这 个 阶段 主要 由 业务 人 员 完 成 。 首 先 调 碍 组 织 机 构 情 况 、 各 部 门 的 业务 
活动 情况 、 协 助 用 户 明 确 对 新 系统 的 各 种 要 求 、 确 定 新 系统 的 边界 。 随 后 调查 、 收 集 与 分 析 用 
户 在 数据 管理 中 的 信息 要 求 、 处 理 要 求 、 安 全 性 以 及 完整 性 要 求 ， 最 终 得 到 数据 流 图 表达 的 数 
据 和 处 理 过 程 的 天 系 。 

除了 上 述 功能 需求 外 ， 性 能 需求 也 需要 在 这 个 阶段 被 定义 。 通 币 包 括 并 发 要 求 、 啊 应 时 间 要 
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求 、 数 据 库容 量 要 求 、LO 吞吐 能 力 要 求 、 系 统 用 户 容量 要 求 和 系统 运行 时 间 要 求 ， 例 如 7X24 
小 时 不 间断 运行 ， 或 者 可 连续 运行 一 周 或 一 月 。 

在 现实 的 设计 实践 中 ， 如 何 才能 获得 真正 有 效 的 性 能 需求 呢 ? 这 需要 从 以 下 三 个 方面 加 以 
A. 

(1) 性 能 指标 必须 量化 

指标 量化 应 该 不 难 理解 ， 但 是 有 了 数字 并 不 代表 就 实现 了 真正 的 量化 。 例 如 常见 的 一 种 需 
求 是 “系统 需要 文 持 5000 用 户 ”， 或 者 “最 大 在 线 用 户 数 为 8000”。 这 些 有 数字 的 需求 仍然 
不 够 明确 ， 因 为 还 需要 区 分 在 线 用 户 和 并 发 用 户 的 区 别 。 为 便于 理解 ， 先 来 看 一 个 性 能 需求 的 
例子 。 

某 个 金融 行业 交易 系统 的 需求 : 

OD 系统 总 容量 达到 日 委托 9000 HÆ, WE 9000 HE. 

D 系统 处 理 速度 每 秒 7300 笔 ， 峰 值 处 理 能 力 达 到 每 秒 10000 笔 。 

(3) 实际 股东 帐号 数 3000 万 。 

这 个 例子 中 己 经 包括 三 个 明确 的 性 能 需求 : 

O 交易 否 吐 量 ; 日 委托 和 日 成 交 都 是 9000 万 笔 。 

(2) 平时 处 理 需 求 : 每 秒 7300 笔 ; 忙 时 处 理 需 求 : 峰值 达到 每 秒 10000 笔 。 

© 用 户 容量 : 实际 股东 帐号 数 3000 万 。 

(2) 有 实际 操作 意义 

一 般 来 说 ， 性 能 需求 要 么 由 集成 商 提出 ， 要 么 由 客户 提出 。 很 多 集成 商 由 于 项 目 进度 的 压 
力 ， 往 往 对 性 能 需求 的 定义 不 太 严 格 ， 靠 拍 脑袋 做 决定 ， 这 是 错误 的 ， 一 定 要 确保 在 定义 性 能 
需求 时 ， 所 使 用 的 数据 和 计算 公式 是 有 根据 的 。 对 于 由 客户 提出 的 情况 ， 例 如 电信 、 银 行 、 保 
险 、 证 券 以 及 一 些 其 他 运营 商 级 系统 的 客户 ， 他 们 和 集成 商 不 一 样 ， 他 们 往往 对 性 能 需求 非常 
认真 ， 但 是 这 又 是 另外 一 个 极端 ， 经 常 提出 超过 实际 需要 的 性 能 需求 ， 这 个 时 候 ， 需 要 耐心 做 
好 说 服 工作 ， 让 客户 明白 性 能 是 有 成 本 的 ， 没 必要 追求 超过 实际 需要 的 性 能 。 

(3) 对 性 能 需求 的 理解 具有 一 致 性 

相关 人 员 对 性 能 需求 的 理解 不 一 臻 通常 是 由 于 参考 对 象 的 不 同 导致 的 。 例 如 有 的 人 员 根 据 
客户 以 往 的 业务 情况 来 分 析 客 户 的 业务 量 ， 有 的 人 员 参 考 其 他 规模 类 似 客户 的 情况 ， 有 的 人 员 
参考 其 他 同行 企业 公布 出 来 的 数据 ;有 的 人 员 参 考 类 似 行业 的 应 用 。 这 就 需要 相关 人 员 使 用 相 
同 的 参考 对 象 来 定义 性 能 需求 ， 否 则 很 难 达 成 一 致 。 


1.3.2 ”设计 概念 模型 

概念 模型 是 按 用 户 的 观点 来 对 数据 和 信息 建 模 ， 通 常用 实体 -关系 图 CE-R ÉD 表示 。 通 过 
对 用 户 需 求 进行 综合 、 归 纳 与 抽象 ， 形 成 一 个 不 依赖 于 具体 数据 库 管理 系统 (DBMS) 的 概念 
数据 模型 , 但 可 以 转换 为 菜 一 DBMS 文 持 的 特定 数据 模型 。 概 念 模型 具有 较 强 的 语义 表达 能 力 ， 
能 够 方便 、 直 接地 表达 应 用 中 的 各 种 语义 知识 。 除 此 之 外 ， 概 念 模型 清晰 、 易 于 用 户 理解 ， 是 
用 户 与 业务 人 员 之 间 进 行 交 流 的 语言 。 

1. 定义 实体 


实体 都 有 一 个 共同 的 特征 和 属性 集 ， 可 以 从 需求 收集 阶段 收集 的 基本 数据 资料 表 中 直接 或 
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间接 标识 出 大 部 分 实体 。 例 如 客户 代码 、 代 理 商 代码 、 产 品 代码 等 将 其 名 词 部 分 代表 的 实体 标 
识 出 来 ， 从 而 找 出 潜在 的 实体 ， 形 成 实体 表 。 

2. 定义 天 系 

关系 模型 中 只 允许 二 元 关系 ，n 元 关系 必须 定义 为 n 个 二 元 关系 。 根 据 实际 的 业务 需求 和 
规则 ， 使 用 实体 联系 怎 阵 来 标识 实体 间 的 二 元 关系 ， 然 后 根据 实际 情况 确定 出 关系 名 和 说 明 。 
这 里 的 关系 类 型 需要 明确 ， 和 是 标识 关系 还 是 非 标识 关系 ? 如 宋 是非 标识 关系 ， 是 强制 的 还 是 非 
强制 ? 如 果子 实体 的 每 个 实例 都 需要 通过 和 父 实 体 的 关系 来 标识 ， 则 为 标识 关系 ， 人 否则 为 非 标 
识 关 系 。 非 标识 关系 中 ， 如 末 每 个 子 实体 的 实例 都 与 而 且 只 与 一 个 父 实体 关联 ， 则 为 强制 的 ， 
侣 则 为 非 强 制 的 。 

3. 定义 码 


通过 引入 交叉 实体 除去 上 一 阶段 产生 的 非 确定 关系 ， 然 后 从 非 交 叉 实 体 和 独立 实体 开始 标 
识 候选 码 属性 ， 以 便 唯 一 识别 每 个 实体 的 实例 ， 再 从 候选 但 中 确定 主 码 。 为 了 确定 主 码 和 关系 
的 有 效 性 ， 通 过 非 空 规 则 和 非 多 值 规则 来 保证 ， 即 一 个 实体 实例 的 一 个 属性 不 能 是 空 值 ， 也 不 
能 在 同一 时 刻 有 一 个 以 上 的 值 。 

4. 定义 属性 


从 基本 数据 表 中 抽取 说 明 性 的 名 词 开 发 出 属性 表 ， 确定 属性 的 所 有 者 。 定 义 非 主 人 码 属 性 ， 
检查 属性 的 非 空 及 非 多 值 规 则 。 此 外 ， 还 要 检查 完全 依赖 函数 规则 和 非 传 递 依 赖 规则 ， 保 证 一 
个 非 主 码 属性 必须 依赖 于 主 码 。 以 此 得 到 了 至 少 符合 关系 理论 第 三 范式 的 改进 的 全 属性 视图 。 

5. 定义 其 他 对 象 和 规则 

定义 属性 的 数据 类 型 、 长 度 、 精 度 、 非 宇 、 缺 省 值 、 约 束 规 则 等 。 

1.3.3 ”设计 逻辑 结构 


本 书 第 4 革 和 第 5 草 将 深入 探讨 如 何 设计 高 质量 的 旬 辑 结构 。 人 和 而 言 之 ， 设 计 迪 辑 结构 首 
先 选 择 最 适合 描述 相应 概念 结构 的 数据 模型 。 数 据 模 型 是 数据 库 系 统 的 核心 ， 主 要 包括 网 状 模 
型 、 层 次 模型 、 关 系 模型 每，DB2 就 是 基于 关系 型 数据 模型 实现 的 。 

数据 模型 优化 的 关键 在 于 确定 数据 依赖 ， 消 除 元 余 的 联系 ， 利 用 范式 对 数据 模型 进行 规范 
化 。 数 据 库 应 用 的 类 型 不 同 ， 所 采用 的 范式 也 会 不 同 。 

数据 库 系 统 从 应 用 上 分 为 事务 型 的 (On-line Transaction Processing, 简写 为 OLTPO 和 分 析 
型 的 《On-line Analysis Processing, fi 5 OLAP) 。 

由 于 OLAP 应 用 和 OLTP HAS MA, MAEL wit EAE. OLTP 应 用 通常 需 
要 尽量 减少 见 余 ， 所 以 采用 第 三 范式 ，OLAP 应 用 中 的 表 结 构 玉 用 星 型 或 雪花 型 模型 ， 以 方便 
合 询 和 多 维 分 析 ， 例 如 业务 数据 (例如 成 本 、 收 入 ) 存储 在 事实 表 中 ， 而 这 些 事实 数据 所 依赖 
的 属性 (例如 时 间 、 地 区 、 产 品 、 客 户 ) 存储 在 维 表 中 。 
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比较 : OLTP 应 用 和 OLAP 应 用 的 区 别 

OLTP 应 用 的 用 户 是 业务 人 员 ， 要 求 非常 快 地 处 理 查 询 和 事务 ,ERP 和 CRM 系统 是 典型 的 
OLTP 系统 ; OLAP 应 用 的 用 户 是 决策 管理 人 员 ， 要 求 处 理 复 杂 查 询 以 及 报表 等 。 关 于 它们 之 间 
的 区 别 如 表 1-1 Pro. 


表 1-1 OLTP 和 OLAP 应 用 之 间 的 主要 区 别 
5O OLAP 应 用 
负载 特点 dd. 244. 报表 和 批量 数据 加 载 
SQL 语句 种 类 SQL 语句 比较 简单 ， 主 要 是 插入 | SQL 语句 比较 复杂 ， 主 要 是 查询 
和 修改 操作 操作 


单 笔 事务 的 资源 利用 率 k 

£s 未 引 比 较 多 

数据 规范 化 里 型 或 雪花 模型 

分 区 技术 DPF. AIE F MDC 结合 使 用 
WAE IT 


X? TR A8 FJ EP] e VE SEE AL Aes E-R 图 转换 为 天 系 模型 ， 即 将 实体 、 实 体 的 属性 和 实体 之 间 的 
联系 进行 转化 。 这 种 转换 一 般 芝 循 如 下 原则 : 一 个 实体 转换 为 一 个 关系 模式 ， 实 体 的 属性 就 是 
关系 的 属性 , 实体 的 码 就 是 关系 的 键 值 。 最 后 , 这 些 关 系 模型 体现 在 对 具体 DBMS 的 表 设 计 上 。 
逻辑 设计 的 过 程 可 分 为 下 和 面 儿 个 步 又 : 

(1) x 

在 关系 表 中 ， 表 中 的 每 个 数据 行 都 是 相关 数据 值 的 集合 。 一 个 表 的 每 一 列 都 必须 具有 对 于 
该 表 唯 一 的 名 称 。 数 据 类 型 和 长 上 度 指定 对 该 列 有 效 的 数据 类 型 和 最 大 长 度 。 主 键 值 是 唯一 的 ， 
一 个 表 上 只 能 有 一 个 主键 。 

(20 表 之 间 的 关系 

主要 包括 一 对 一 、 一 对 多 和 多 对 多 。 一 对 一 关系 在 两 个 方 癌 都 是 单 值 的 ， 例 如 一 个 经 理 管 
理 一 个 部 门 ， 一 个 部 门 上 只 有 一 个 经 理 。 一 对 多 关系 中 ， 一 个 职员 只 能 在 一 个 部 门 工 作 ， 对 于 职 
员 ， 此 关系 是 单 值 的 ， 另 一 方面 ， 一 个 部 门 可 有 许多 职员 ， 对 于 部 门 ， 此 关系 是 多 值 的 。 两 个 
方向 都 是 多 值 的 关系 是 多 对 多 关系 。 一 个 职员 可 以 处 理 多 个 项 目 , 而 一 个 项 目 可 以 有 多 个 职员 。 

(30 数据 完整 性 设计 

约束 使 DBMS 能 够 防止 不 正确 的 或 意外 的 数据 输入 表 中 ， 从 而 确保 表 中 数据 的 完整 性 。 
DB2 有 下 面 几 种 类 型 的 约束 。 

e 唯一 约束 (unique constraint) 防止 一 个 值 在 表 中 的 特定 列 里 出 现 不 止 一 次 。 必 须 将 唯 

一 约束 中 所 引用 的 列 定 义 为 非 空 CNOT NULL) ) 。 
e 引用 约束 (referential constraint) 用 来 在 表 之 间 建 这 引用 关系 ， 这 两 个 表 通 背 称 为 子 
表 和 父 表 。 当 在 父 表 或 子 表 中 插入 /删除 /更 新 的 数据 满足 预定 义 的 条 件 时 ， 束 执行 这 
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e KAAR (table check constraint) 针对 一 个 或 多 个 表 列 定义 检查 约束 ， 它 们 可 以 对 
列 实施 指定 的 规则 ， 使 这 些 列 中 插入 或 更 新 的 数据 满足 检查 约束 中 预先 定义 的 条 件 。 

e 信息 约束 Cnformational constraint? 是 SQL 编译 器 的 规则 ， 依 赖 于 有 具体 的 DBMS 厂商 
的 实现 ， 通 党 不 需要 设计 开发 人 员 干 预 。 

(4) 索引 设计 

针对 数据 的 得 询 和 应 用 需要 ， 在 表 的 某 些 列 上 建立 索引 或 组 合 索 引 。 

(5) 数据 组 织 方案 

DB2 提供 了 一 种 三 级 数据 组 织 方案 , 这 些 组 织 方案 单独 使 用 , 也 可 以 同时 使 用 。 如 下 所 示 : 

e 数据 库 分 区 (DPF) : 数据 均匀 地 分 布 在 数据 库 分 区 上 ， 以 局 用 得 询 内 并 行 性 并 平衡 每 


个 数据 库 分 区 上 的 负载 。 
e KIX (Table Partition) : 同一 个 表 中 的 数据 可 以 根据 键 值 的 范围 放 到 不 同 的 表 分 
区 中 。 


e 多 维 集 群 (MDC): 将 多 个 维 上 具有 相同 值 的 行 放 到 同一 个 物理 块 中 。 
1.3.4 ”设计 物理 结构 


逻辑 数据 模型 是 数据 的 理想 玛 图 ， 物 理 数 据 模型 才 是 对 数据 的 物理 实现 。 物 理 结构 设计 中 
需要 重点 考虑 的 问题 ， 本 书 第 3 章 将 进行 深入 探讨 。 

在 数据 库 系 统 建 设 初期 ， 系统 染 构 师 需要 根据 当前 的 业务 情况 、 对 未 来 发 展 的 规划 以 及 建 
设 经 费 等 情况 进行 评估 。 在 便 件 选 型 时 ， 不 能 训 目 选择 高 档 便 件 ， 要 根据 评估 结 末 科学 选择 ， 
基体 便 件 选 型 请 参考 本 书 第 3 草 的 有 关内 容 。 

完成 便 件 选 型 后 ， 接 下 来 就 是 根据 DB2 的 特点 和 处 理 的 需要 ， 进 行 存 储 规 划 、 组 冲 池 规 划 
AIL "rt TR] AXI S o 

(1) 存储 规划 : 对 于 数据 库 系统 来 次 , 存储 规划 至 天 重 要 , 首先 要 设计 合理 的 RAID 级 别 ， 
这 样 可 以 实现 磁盘 阵列 的 高 效 恋 写 。 随 后 在 磁盘 阵列 上 规划 好 这 几 个 重要 的 存储 空间 ， 包 括 实 
例 目 录 、 数 据 库 目 录 、 数 据 、 活 动 日 志 、 归 档 日 六 、 备 份 以 及 临时 数据 等 。 

(2) 内 存 设 置 和 规划 : 主要 完成 实例 共 圣 内 存 、 数 据 库 共 人 圣 内 存 、 应 用 程序 全 局 内 存 和 
代理 私有 内 存 的 设置 ， 除 此 以 外 ， 要 规划 好 缓冲 池 ， 它 对 性 能 影响 最 大 。 妆 然 完 全 徘 DBA 来 
设置 内 存 比较 复杂 ， 所 以 可 以 结合 DB2 提供 的 目 调 优 内 存 管理 (STMM) ， 这 样 可 以 大 大 所 局 
效率 。 

(3) RTM): DB2 中 有 两 种 类 型 的 表 空 间 ， 分 别 是 系统 管理 的 表 空 间 (SMS) AUR 
据 库 管理 的 表 空间 (DMS)〉。 它 们 之 间 的 区 列 在 于 ，DMS 表 空 间 所 需要 的 空间 是 在 创建 时 分 
配 的 ; SMS 表 空 间 是 根据 需要 分 配 的 。 在 创建 表 空 间 时 ， 需 要 指定 存放 容 如 ， 这 里 容 妖 可 以 是 
目录 名 、 设 备 名 或 者 文件 名 。 为 了 提 忆 性 能 和 更 灵活 地 配置 ， 单 个 表 空 间 可 器 多 个 容 右 。 由 于 
DMS 表 空 间 性 能 更 高 ， 押 以 大 部 分 情况 下 使 用 DMS 表 空 间 是 一 种 最 佳 选择 。 


1.8.5 ”应 用 开发 阶段 
设计 完成 后 ， 就 进入 开发 阶段 了 ， 这 个 阶段 DBA 会 将 物理 设计 的 结果 部 署 到 目标 开发 机 
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磊 上 ， 随 后 开 及 人员 开 始 编写 应 用 代码 以 实现 业务 逻辑。 

很 多 开发 人 员 痢 遇 到 过 这 样 的 情况 : 在 应 用 系统 开发 初期 ， 由 于 开发 数据 库 中 的 数据 比较 
^b, 对 于 和 奉 询 语句 和 存储 过 程 等 的 编写 体会 不 出 SQL 语句 各 种 写法 的 性 能 优 务 , 但 是 如 来 将 应 
用 系统 提交 上 线 使 用 后 ， 随 看 数据 库 中 数据 的 增加 ，SQL 语句 的 优 劣 很 容易 就 体现 出 来 了 。 特 
别 是 面 对 海量 数据 ， 劣 质 SQL 语句 和 优质 SQL 语句 之 间 的 速度 差别 可 以 达到 上 百倍 ， 可 见 对 
于 一 个 系统 不 是 简单 地 能 实现 其 功能 即 可 , 而 是 要 写 出 高 质量 的 SQL 语句 , 提高 系统 的 可 用 性 。 

所 以 ， 在 这 个 阶段 ， 不 仅 要 做 好 功能 测试 ， 还 要 模拟 生产 环境 的 数据 量 做 好 集成 测试 和 性 
能 测试 ， 直 到 所 有 训 试 完成 后 才能 正式 上 线 。 


1.3.6 ”运行 维护 阶段 

这 个 阶段 主要 是 完成 数据 库 和 应 用 的 部 署 工 作 ， 随 后 上 线 试 运行 ， 通 过 试 运行 来 验证 设计 
和 开发 是 否 满 足 了 需求 ， 并 做 必要 的 调整 。 经 过 试 运行 后 ， 数 据 库 应 用 系统 即 可 投入 正式 运行 。 
在 数据 库 系 统 运 行 过 程 中 还 需要 持续 对 系统 以 及 工作 负载 进行 性 能 监控 、 诊 断 与 优化 。 


1.4 性 能 调整 与 优化 


如 采 数 据 库 系统 已 经 处 于 维护 阶段 了 ， 这 时 遇 到 了 性 能 问题 ， 使 用 目 上 而 下 方法 学 肯定 是 
来 不 及 了 ， 只 能 采用 目下 而 上 方法 和 学， 使 用 这 种 方法 和 学， 其 目标 是 找到 性 能 瓶颈 并 加 以 解决 。 
如 图 1-2 所 示 ， 生 产 环境 中 巡 到 的 性 能 瓶 祷 可 以 归结 为 下 面 五 种 闫 型 


7. db2top 


懒惰 系统 


PL EEXISR 


CPUN 


IA HLEN 


图 1-2 ”性 能 瓶颈 种 类 


(1) 磁盘 瓶颈 :， 磁盘 UO 是 数据 库 性 能 的 瓶颈 。 

(2) CPU 瓶颈 : CPU 是 数据 库 性 能 的 瓶颈 。 

(3) We: 内 存 是 数据 库 性 能 的 瓶颈 。 

(4) 网 络 瓶 颈 : 客户 端 和 数据 库 服务 器 之 间 ， 或 者 DB2 pureScale 集群 各 个 成 员 和 CF 之 
间 ， 或 者 数据 仓库 DPF 节点 之 间 存 在 网 络 瓶 贷 ， 就 会 导致 数据 库 性 能 变 慢 。 
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(5) “懒惰 系统 ”: 数据 库 运 行 变 慑 ， 但 从 监控 来 看 ， 倒 盘 、CPU 和 内 存 都 很 空闲 。 
1.4.1 磁盘 瓶颈 


人 厂 盘 瓶颈 的 基本 症状 是 : 在 vmstat 或 iostat 结果 中 , 出 现 较 长 的 IO 等 竺 时间, 较 低 的 CPU 
利用 率 (2596-5094) ， 磁 盘 较 高 的 繁忙 程度 (80%)。 对 于 磁盘 瓶颈 ， 首 先 需 要 找到 繁忙 设备 所 
在 的 文件 系统 路 径 ， 接 下 来 ,查看 在 这 些 文 件 系统 路 径 上 都 驻 留 了 哪些 数据 库 对 象 ， 例 如 热 表 、 
热 索 引 、 临 时 表 、 日 志 。 最 后 ， 根 据 这 些 数 据 库 对 象 的 不 同 进行 针对 性 的 分 析 。 


1. 热 表 导致 的 瓶颈 


检查 繁忙 设备 所 在 的 文件 路 任 上 都 有 哪些 数据 表 空 间 ， 这 些 表 空 间 上 都 有 哪些 热 表 ， 找 到 
热 表 后 进一步 向 下 钻 取 ， 找 出 什么 造成 了 这 些 表 的 高 度 活 跃 。 是 动态 SQL 语句 造成 的 高 度 活 
EK? 还 是 静态 SQL 语句 导致 的 高 度 活 跃 ? 一 旦 确定 一 个 或 多 个 SQL 语句 导致 了 UO 瓶颈 ， 下 
一 步 需要 确认 这 个 语句 是 否 可 以 被 优化 以 降低 WO。 例 如 ， 这 个 语句 是 否 发 起 了 一 个 针对 大 表 
的 表 扫 描 ? 是 否 可 以 通过 增加 缓冲 池 大 小 来 消除 UO 瓶 贷 ? 整 个 过 程 如 图 1-3 所 示 。 


数据 表 空 间 


. ifj SYSCAT. TABLES 


2. 查询 SYSIBMADM.SNAPTAB 
3. MON GET TABLE 


1.£& ig SYSIBMADM.SNAPDYN SQL.TBSP ID 
2. 获 取 快 照 信息 snapshot 
3.TOP DYNAMIC SQL (Exec Time, Sorts) 


4. 视 图 
Long Running SQL(Time, Statements, Status) 
QUERY PREP COST(High Prep Times % of Exec) 


$. 表 函数 

MON GET ACTIVITY DETAILS(Executing v. Waiting) 
MON GET PKG CACHE STMI(Filting Options) 

6. 事 件 监 视 器 


Event Monitor 


问题 SQL 优化 


图 1-3 数据 表 空 间 性 能 优化 树 


存储 过 程 


2. 热 达 引导 致 的 瓶颈 


如 图 1-4 所 示 的 分 析 过 程 ， 检 查 索 忙 设 备 所 在 的 文件 路 径 上 都 有 哪些 索引 表 空 间 ， 这 些 索 
引 表 衬 间 中 都 有 什么 热 票 引 ， 其 中 哪些 索引 是 高 度 活跃 的 。 在 OLTP 系统 中 ， 可 以 符 试 下 面 的 
方法 ， 例 如 增加 缓冲 池 的 大 小 ， 或 为 索引 指定 专门 的 缓冲 地 ， 从 而 降低 IO 来 消除 瓶 领 。 但 在 
OLAP 环境 中 ， 索 引 通 利 非 常 大， 分 配 足 够 的 缓冲 池 来 消除 VO 不 大 可 能 ， 这 种 情况 下 ， 通 过 
增加 额外 的 容器 以 提高 磁盘 IO 并 行 度 来 消除 瓶 领 或 许 更 加 有 效 。 
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.查看 SYSIBMADM.SNAPTBSP 
2. 查看 SYSCAT.TABLES 


3. db2pd -tcbstats index -dbname 
4.MON GET INDEX 


1. NUM. LOG BUFFER FULL 


2. SYSIBMADM.SNAPDB 
3.SYSIBMADM.MON BP UTI 
LIZATION 


db2exfmt 确 定 使 用 
该 索引 的 问题 SQL 


43.SYSIBMADM.BP HITRATI 


o 
5.SNAP GET BP V95() 


问题 SQL 优化 


TED PEE d 
CER S | ETE AO 


图 1-4 索引 表 空 间 优化 树 


D 整 绥 证 7th, 


3. 用 忆 临 时 表 的 频 楷 读 写 导致 的 瓶颈 

检查 索 忙 设备 所 在 的 文件 路 径 上 都 有 哪些 用 户 临时 表 空 间 ， 这 些 用 户 临时 表 空 间 中 都 有 什 
么 频 索 访问 的 临时 表 。 由 于 排序 溢出 或 者 庞大 的 中 间 结 束 ， 导 致 对 用 户 临时 表 的 频 款 读 写 进而 
造成 磁盘 瓶 贷 ， 分 析 诊 断 过 程 如 图 1-5 所 示 。 


临时 表 空 间 


2.iostat 
3. 观 测 到 大 量 中 间 结 果 


4. SYSIBMADM.SNAPTBSP 


1. HEFE 


2. get snapshot 


3. SYSIBMADM.SNAPDB 
4.SYSPROC.MON GET WORKLOA 
DO 


1. NUM. LOG. BUFFER FULL 


Ifa E] e TT 


i H 一 。 

|n] WS QL 优 化 2. SYSIBMADM.SNAPDB 
3.SYSIBMADM.MON BP UTI 
LIZATION 

4.SYSIBMADM.BP HITRATI 
o 

5.SNAP_GET_BP_V950 


EGITDGDI 


调整 缓冲 池 


图 1-5 临时 表 空 间 容 器 优化 树 


4. 日 志 设 备 的 频繁 读 写 导致 的 瓶颈 


检查 繁忙 设备 所 在 的 文件 路 径 上 是 否 用 于 存放 事务 日 志 。 因 为 日 志 的 读 写 速度 能 影响 系统 
H IH IJ INSERT/UPDATE/DELETE 语句 ,所 以 日 志 设 备 的 读 写 速度 对 数据 库 性 能 有 重大 影响 。 
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建议 日 志和 数据 要 放 在 不 同 的 物理 盘 上 ， 避 免 出 现 磁 盘 争 用 。 关 于 日 志 设 备 瓶 棋 的 分 析 诊 断 过 
程 如 图 1-6 所 示 。 


3. app snapshot 


4. df -k 确定 日 志文 件 目录 


5. get db cfg for dbname | grep -1 "path to log files" 


6. get snapshot for all on dbname 


T. LOG UTILIZATION 
8. SNAPDB 
9. locking event monitor 


10.MON GET WORKLOAD(Q) 
11.db2pd -logs 


1.NUM LOG BUFFER FULL 
2. STSIBM ADM.SNAPDR 
ASYSIBMADM.MON BP UTI 


Era HriB v LM LIZATION 
ARBE o E 4.SYSIBMADM.BP HITRATI 


5.SNAP GET BP V950) 


图 1-6 “日志 存储 问题 优化 树 


JN 注意 : db2diag.log 的 频繁 写 入 也 会 导致 [ek EJ 

db2diag.log 的 频繁 写 入 也 会 造成 IO 瓶颈 ， 特 别 是 在 多 分 区 环境 中 ， 所 有 分 区 通过 
NFS 文件 系统 共享 诊断 日 志文 件 , 这 对 性 能 的 影响 更 大 。 解决 这 个 问题 最 简单 的 办 法 是 
为 每 个 分 区 指定 一 个 单独 的 诊断 日 志 路 径 和 一 个 单独 的 诊断 日 志文 件 。 


1.4.2 CPU Jt £i 


CPU 瓶 绒 表现 在 两 个 方面 : 用 户 态 CPU MMRR CPU 瓶颈 。 运 行 操作 系统 内 核 以 外 的 
软件 时 导致 的 瓶 开 为 用 户 态 CPU 瓶 领 ,运行 操作 系统 内 核 的 时 候 导 致 的 瓶 领 为 系统 态 CPU MN. 
用 户 态 CPU 和 系统 态 CPU 时 间 比 率 在 3:1 到 4:1 之 间 是 正常 的 。 如 果 在 有 瓶颈 的 系统 中 ， 用 户 
和 系统 时 间 比 率 高 于 这 个 区 间 ， 就 应 该 分 析 用 户 态 CPU 时 间 增 加 的 原因 。 


Aa 注意 : CPU 并 不 是 利用 率 越 低 越 好 | 
很 多 读者 觉得 CPU 利用 率 越 低 越 好 ， 这 是 不 完全 正确 的 ，CPU 利用 率 应 在 一 个 合 
理 范围 内 。 在 OLTP 应 用 中 ，CPU 利用 率 越 低 ， 说明 CPU 有 浪费 ， 如 果 设 计 合 理 ， 应 
该 能 充分 利用 硬件 资源 ，CPU 利用 率 越 高 就 说 明 资 源 得 到 了 最 充分 的 利用 ， 反 而 是 件 
FFT. 


1. 用 户 态 CPU 瓶颈 
对 用 户 态 CPU 瓶颈 的 诊断 分 析 ， 如 图 1-7 所 示 ， 主 要 从 以 下 四 个 方面 去 分 析 。 


14 


第 1 章 性 能 优化 方法 学 2m 


1. 获 取 快 照 信息 snapshot 
2.TOP DYNAMIC SQL (Exec Time, Sorts) 


3. 视 图 
Long Running SQL(Time,Statements,Status) 
QUERY PREP COST(High Prep Times % of Exec) 


4. 表 函数 

MON GET ACTIVITY DETAILS(Executing v. Waiting) 
MON GET PKG CACHE STMT(Filting Options) 

5. 事 件 监视 器 


Event Monitor 


人 y Y 
Vii 
高 耗费 CPU 的 SQL 语 名 压缩 2. list utilities show detail de EET 
db2load,runstats 
等 实用 程序 占用 CP 


图 1-7 用 户 态 CPU 瓶颈 优化 树 


(1) 首先 通过 监控 工具 找到 对 应 的 动态 SQL 语句 和 静态 SQL 语句 ， 随 后 从 以 下 方面 进行 
优化 : 
e 避免 对 大 表 进行 频繁 的 表 扫 描 ， 这 样 会 消耗 大 量 的 CPU 时 间 ， 建 议 创建 合理 的 索引 。 
e 许多 应 用 程序 通过 字符 串 拼接 SQL 语句 查询 条 件 , 这 会 消耗 CPU 时 间 , 建议 使 用 参数 
标记 。 
e 如 果 应 用 程序 执行 一 个 SQL 语句 却 只 会 用 到 一 小 部 分 产生 的 数据 ， 建 议 使 用 
OPTIMIZE FOR n ROWS (OFnR) 和 FETCH FIRST n ROWS ONLY CFFnRO) 子 句 ， 
这 样 可 以 减少 CPU 消耗 。 
(20 如 末 对 表 局 用 压缩， 那么 会 消耗 CPU 时 间 。 
(3) 在 一 个 实用 工具 正在 运行 时 ，CPU 使 用 率 会 有 显著 的 增加 。Load 和 runstats 束 是 很 
好 的 例子 ， 它 们 经 常 导致 CPU RIA] SEE B. 
CA) 当 删 除 临 时 表 的 时 候 ，DB2 必须 从 绥 剖 池 中 移 除 不 再 需要 的 页 和 面 。 如 末 此 操作 经 第 
发 生 ， 并 且 临 时 表 和 普通 用 户 数据 共享 绥 神 池 ， 会 耗费 额外 的 CPU 时 钟 周 期 来 解决 冲突 
. 系统 态 CPU 瓶颈 


在 大 多 数 CPU 受 限 的 环境 中 用 户 CPU 往往 是 决定 因 系 , 不 过 系统 CPU 有 了 时 也 能 成 为 决定 
因素 。 如 图 1-8 所 示 ， 系 统 CPU 瓶颈 可 能 由 以 下 几 方 面 造 成 : 

(1) 操作 系统 上 下 文 切换 率 过 高 。 当 上 下 文 切换 得 太 频 楷 ， 会 消耗 大 量 CPU 时 间 。 导 致 
上 上 下文 切换 率 高 的 原因 可 能 是 有 大 量 的 DB2 连接 。 

(20 设备 中 断 也 会 导致 CPU 时 间 高 。 一 次 中 断 的 成 本 并 不 高 ， 然 而 如 果 中 断 的 频率 太 高 ， 
总 的 负载 会 非常 高 。 

(3) DB2 数据 库 占 可 用 内 存 的 50% 左 右 通 常 比较 合适 ， 如 果 分 配 了 过 多 的 内 存 给 DB2 从 
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而 导致 操作 系统 可 用 内 存 不 足 ， 这 样 页 清除 操作 将 造成 系统 CPU 开销 。 


AR BUS CPUJIR SS 


1 .vmstat 
2.nmon 
3.top 
4 .db 2top 
MON GET CONNECTION 内 存 分 配 过 多 


高 频率 的 
上 下 文 切换 


内 存 页 过 小 / 
系统 内 存 不 足 


图 1-8 系统 态 CPU 瓶颈 优化 树 


1.4.83 AEH 


如 条 没有 充足 的 内 存 ， 数 据 在 填 满 缓冲 后 吏 将 转向 WO， 在 这 个 过 程 中常 第 也 会 造成 磁盘 
版 贷 。 男 外 ， 内 存 也 被 用 来 存储 元 数据 和 运算 结 末 ， 比 如 SQL 奉 询 计划 和 锁 。 如 采 缺 少 内 存 ， 
系统 不 得 不 取消 或 销毁 那些 重要 信息 ， 并 在 稍 后 需要 时 重新 计算 ， 从 而 增加 了 CPU 的 开销 。 因 
此 ， 有 时 候 一 个 内 存 瓶 祷 的 表现 形式 可 能 是 人 磁盘 或 CPU 问题 。 

为 了 分 析 和 诊断 内 存 瓶 殊 ， 可 用 从 以 下 方面 入 手 ， 如 网 1-9 所 示 : 


1. vmstat 


2. ps 


get db cfe 
SNAPDB MEMORY POOL 
get dbm cfe SNAPAGENT MEMORY POOL 
SNAPDBM MEMORY POOL 


图 1-9 内存 瓶颈 优化 树 


(1) 实例 级 和 数据 库 级 : 主要 是 共享 内 存 ， 包 括 缓冲 池 、 排 序 堆 、 锁 列表 、 包 缓存 等 。 
共享 内 存 受到 INSTANCE MEMORY fll DATABASE MEMORY 配置 参数 的 限制 ， 它 和 数据 库 
连接 数 没有 关系 。 

(20 连接 层面 或 应 用 程序 级 分 配 : 包括 应 用 程序 堆 和 语句 堆 ， 内 存 消 耗 明 显 依赖 于 连接 数 。 

无 论 是 否 启 用 STMM， 判 断 DB2 内 存 实际 用 量 的 最 好 办 法 就 是 查看 数据 库 管 理 器 、 数 据 
库 和 应 用 程序 快照 的 内 存 使 用 部 分 ， 它 们 提供 了 实例 、 数 据 库 和 应 用 各 目的 内 存 配置 大 小 和 当 
前 实际 内 存 大 小 。 
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1.4.4 fgzEXRSW 
如 图 1-10 所 示 ， 通 常 网 络 方面 的 性 能 问题 主 
要 表现 在 以 下 三 个 方面 : 
CIO 客户 端 和 服务 器 之 间 网 络 问题 。 例 如 业 


Vj £& XR, E 


l netstat 
务 数据 量 达到 网 络 所 能 允许 的 峰值 ， 或 者 服务 器 ZSYSIDMADM SNAPDB 
jm al [n| 2e P1 9m Je AS S SE NJ] Cg US Su -i HE SUMMARY 


(20 在 DPF 多 分 区 环境 下 , 不 同市 点 之 间 通 
信 的 问题 。 例 如 ， 不 同市 点 之 间 通 信和 数据 量 过 大 ， 
导致 网 络 延 时 ， 啊 应 时 间 变 慢 等 。 

(3) 在 DB2 pureScale 集群 环境 中 ，CF 节 SE 
点 和 成 员 节 点 之 间 需 要 交互 大 量 数据 ， 所 以 推荐 使 用 Infiniband 网 络 或 者 万 兆 网 ， 如 果 网 络 
存在 性 能 瓶 琉 ， 束 会 导致 严重 的 性 能 问题 。 


1.4.5 “懒惰 系统 


还 有 一 种 “懒惰 系统 ”的 性 能 问题 ， 没 有 明显 的 CPU、 磁盘、 内 存 或 网 络 瓶 颈 ， 系 统 也 不 
忙 。 如 图 1-11 所 示 导 致 懒惰 系统 的 儿 种 可 能 性 ， 现 在 分 别 叙 述 一 下 。 


DB2 pureScale 节 
A [8] 388 fii 10] A 


客户 端 与 服务 器 间 


DPF [8i 
网络 问题 | 


fa l) 


1. 事件 监视 器 

监视 器 

监视 器 
2. dk tua a E. CB 
db2pd» 
ssysibrmadm.snapdb 
sysibmadm.snaplockwait 
sysibmadm.snapdb.lock escals 


db2pd -locks 
db2 get snapshot 


3. 获 得 应 用 端 响应 信息 


sysibmadm.snapappl info 


BERE 


锁 升 级 


Ap Pii HW 
A P mg P) et 


CDD 在 “懒惰 系统 ”中 一 个 最 常见 的 原因 是 锁 等 待 。 锁 等 待 是 很 容易 在 快照 数据 中 被 检 
得 到 的 。 奏 询 管理 视图 sysibmadm.snapdb J^ Et lock wait time 和 locks _ waiting， 可 以 看 到 锁 
等 待 时 间 和 当前 正在 等 待 锁 的 代理 进程 数 。 

(2) 为 了 防止 请 求 锁 的 应 用 程序 无 限期 等 待 ，DB2 提供 了 LOCKTIMEOUT 数据 库 参 数 ， 
当 锁 等 待 的 时 间 超 过 这 个 参数 的 设 定 值 ， 束 会 返回 出 错 消 肯 ， 并 回 深 事 务 ， 这 束 是 锁 超时 。 当 
LOCKTIMEOUT 的 值 设 置 为 -1《〈 这 也 是 缺 省 值 ) 时 ， 请 求 锁 的 应 用 程序 会 无 限期 等 竺 。 

(3) 锁 升 级 也 是 “懒惰 系统 ”中 一 个 种 见 现象 ， 锁 升级 导致 的 块 或 表 级 唱 的 锁 会 产生 严 
重 的 性 能 问题 。 


图 1-11 懒惰 系统 优化 树 
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(4) 另外 还 有 死 锁 也 会 导致 “懒惰 系统 ”。 死 锁 和 应 用 程序 有 很 大 关系 ， 从 数据 库 层 面 
监控 和 诊断 ， 最 终结 合 应 用 程序 来 解决 。 

(5) DB2 预 取 器 、 页 清除 需 数 目 过 小 ， 也 是 导致 籁 情 系 统 的 一 个 重要 诛 因 。 

(6) DB2 服务 器 运行 正 般 ， 但 是 由 于 客户 站 应 用 程序 编写 的 质量 问题 ， 有 时 候 也 会 导致 


从 上 面 看 出 ， 大 部 分 时 候 是 由 于 锁 问 题 导 致 的 ， 关 于 这 块 具体 内 容 请 参考 本 书 第 8 章 相 关 
章节 。 
1.4.6 ”关键 SQL 语句 优化 


通过 对 上 述 性 能 瓶 贷 的 深入 分 析 , 很 多 读者 会 发 现 应 用 中 包含 的 一 些 关 键 SQL 语句 往往 是 
性 能 瓶颈 的 根源 。 下 面 我 们 来 简单 探讨 一 下 如 何 对 关键 SQL 语句 进行 优化 。 


很 多 读者 可 能 会 芭 ， 就 是 如 何 编写 SQL 语句 ， 这 种 理解 
不 全 面 。 因 为 优化 SQL 语句， 修改 语句 只 是 其 中 一 种 方式 ， 优 化 的 关键 是 分 析 和 调整 
其 访问 计划 。 


如 图 1-12 所 示 ， 关 键 SQL 语句 包括 动态 语句 和 静态 语句 ， 其 优化 方法 包括 手工 方式 和 
Design Advisor 工具 方式 。 手 工 方式 需要 靠 DBA 自己 分 析 查 询 计 划 ， 自 己 使 用 索引 或 者 表 分 区 
技术 优化 SQL 语句 ; Design Advisor 工具 方式 的 好 处 在 于 方便 快捷 , 它 可 以 自动 给 出 专家 建议 ， 
包括 设计 索引 、 设 计 表 分 区 、 设 计 MQT 或 者 设计 MDC. 


关键 SQL 《静态 、 A 


IET MUT 


2. db2exfmtáp 1143 9T 


3. Visual Explain 图 形 化 分 析 


Design Advisor 


EI S 


SQL 语句 SQL 语句 


图 1-12 关键 SOL 语句 优化 树 


AT SQL 语句 优化 的 技术 ， 请 参阅 本 书 第 9 半 的 相关 内 容 。 


1.5 性 能 优化 基本 准则 


让 DB2 数据 库 你 持 展 好 的 性 能 ， 这 并 不 是 一 件 容 易 的 事情 。 根 据 我 们 的 优化 经 验 ， 特 给 出 
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以 下 基本 准则 ， 供 读者 参考 。 

C1) 20/80 原则 也 适用 于 性 能 优化 

随 看 应 用 和 数据 库 越 来 越 大 ， 人 全面 调 整 应 用 变 得 代价 高 员 ， 所 以 ，20/80 原则 的 运用 显得 
尤为 重要 。 这 是 因为 ，80% 的 数据 库 性 能 问题 是 由 20% 的 应 用 导致 的 ， 换 句 话 说， 只 要 优化 这 
20% 的 关键 应 用 部 分 ， 束 能 解决 80% 的 问题 。 

(2) 对 OLTP 应 用 和 OLAP 应 用 要 区 别 对 待 

性 能 优化 目标 和 应 用 的 种 类 是 紧密 相关 的 ， 不 同 的 应 用 种 类 要 采用 针对 性 的 技术 运用 策 
略 。 针 对 OLTP 应 用 ， 尽 最 大 努力 提升 系统 的 响应 速度 是 首要 的 优化 目标 ， 而 对 OLAP 应 用 ， 
则 以 整体 数据 吞吐 量 为 目标 。 

(30 数据 库 的 设计 对 数据 库 性 能 有 公关 重要 的 影响 

在 逻辑 设计 过 程 中 ， 一 定 要 确保 用 最 合理 的 数据 库 技 术 来 实现 业务 逻辑 ， 例 如 表 、 索 引 、 
表 分 区 、 数 据 库 分 区 、 压 缩 等 。 在 物理 设计 时 ， 要 合理 地 利用 硬件 资源 ， 这 了 加 要 求 要 有 民 好 的 
存储 设计 、 缓 冲 池 设计 、 表 空间 设计 等 。 

(40. 应 用 开发 的 质量 也 会 对 数据 库 性 能 产生 重要 影响 

一 定 要 重视 应 用 开发 的 质量 ， 要 确保 应 用 持 有 锁 的 时 间 尽 量 短 ; 要 对 DB2 优化 器 有 一 定 程 
度 的 了 解 ， 这 样 可 以 通过 分 析 SQL 语句 的 访问 计划 来 判断 SQL 语句 性 能 是 否 高 效 ， 要 特别 重 
视 索 引 的 运用 ， 因 为 有 时 候 一 个 合理 的 索引 能 对 和 查询 语 名 有 极 大 的 性 能 提升 。 

(5) 合理 配置 系统 参数 和 数据 库 参 数 

合理 配置 参数 是 性 能 提升 的 必要 条 件 ， 所 以 要 务必 保证 参数 得 到 合理 配置 。 

(60 运用 维护 窗口 做 好 数据 库 维护 工作 

生产 库 在 运 维 中 ， 都 会 有 维护 窗口 供 使 用 。 所 以 ， 在 维护 窗口 期 间 ， 要 及 时 执行 runstats， 
以 使 得 优化 器 有 最 狐 的 统计 信息 ; 也 要 及 时 执行 reorg， 这 样 当 有 频 索 的 插入 、 删 除 和 更 新 操作 
后 ， 数 据 能 得 到 重新 整理 从 而 提高 性 能 。 


1.6 -h2 
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方法 学 ， 即 目 上 而 下 方法 学 和 目下 而 上 方法 学 。 

如 果 要 建设 一 个 新 的 数据 库 系 统 ， 那 么 必然 会 经 历 设计 、 开 发 和 维护 的 各 个 阶段 ， 按 照 目 
上 而 下 方法 学， 在 考虑 业务 功能 实现 的 同时 ， 性 能 优化 应 员 彻 始终 ， 越 早 越 好 ， 因 为 开始 的 越 
早 ， 其 付出 的 成 本 也 就 越 小 。 

如 采 数 据 库 系统 已 经 处 于 维护 阶段 了 ， 这 时 遇 到 了 性 能 问题 ， 那 么 使 用 目 上 而 下 方法 学 肯 
定 是 来 不 及 了 ， 只 能 采用 目下 而 上 方法 学 。 按 照 目 下 而 上 方法 党， 本章 讲解 了 5 种 类 型 的 性 能 
MLW, BRER CPU 瓶 领 、 内 存 瓶 多 、 网 络 瓶 筑 和 懒惰 系统 ， 并 给 出 了 相应 的 监控 和 分 析 
方法 。 最 后 ， 与 大 家 分 吝 了 性 能 优化 的 基本 准则 。 
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某 汽车 制造 商 的 ERP 应 用 系统 出 现 了 性 能 问题 ， 经 过 调查 发 现 ， 要 想 彻 底 解决 这 个 问题 
就 需要 对 支撑 该 ERP 应 用 的 Oracle RAC 数据 库 o 但 是 成 本 高 昂 ， 无 法 满足 客户 
降低 总 体 拥有 成 本 的 需要 。 这 时 ， 我 们 提出 的 “ 架构 方案 得 到 了 该 客户 的 高 度 认 可 。 本 
章 基 于 此 方案 ， 详 细 讲 述 DB2 经 营 分 析 库 和 DB2 HADR — 中 间 也 穿插 分 享 
DBA 需要 重视 的 物理 设计 、 逻 辑 设计 等 —! 最 后 ， 介 绍 通过 自 下 而 上 方法 学 如 何 成 功 解 
决 这 个 系统 上 线 一 段 时 间 后 遇 到 的 性 能 问题 

让 我 们 开始 这 M E 
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2.1 性 能 问题 的 提出 


我 们 优化 过 很 多 数据 库 系 统 ， 刚 开始 面临 的 状况 几乎 都 是 一 样 的 : 当 接 到 客户 报告 性 能 问 
题 时 ， 往 往 是 问题 已 经 比较 严重 了 ， 而 且 已 经 影响 了 业务 的 正 芝 运转 ， 这 个 时 候 客 户 处 于 非 锦 
焦急 但 又 束手无策 的 状态 ， 现 在 这 个 汽车 制造 商 的 性 能 问题 也 不 例外 。 


2.1.1 系统 现状 : 从 Oracle RAC 谈 起 


如 图 2-1 所 示 ， 这 个 数据 库 系 统 基于 典型 的 Oracle RAC 集群 架构 ， 选 择 Oracle RAC 是 为 
了 高 可 用 性 和 负载 均衡 的 需要 ，Oracle 数据 库 的 版 本 为 11jg， 包 括 两 个 节点 ， 一 个 是 节点 0， 另 
一 个 是 节点 1， 这 两 个 节点 各 自 运 行 在 独立 的 Power 740 服务 器 上 ， 其 中 硬件 配置 为 16 个 CPU 
内 核 ，64G 内 存 ， 操 作 系 统 为 AIX 6.1; 共享 存储 使 用 IBM V7000，SAN 交换 机 将 该 存储 和 下 
点 0. "ax 1 互联 :网 络 方面 ， 私 网 交换 机 《 千 兆 ) 实现 双 节 点 的 内 部 互联 ， 公 网 交换 机 《于 
JE) 实现 双 节 点 和 ERP 应 用 的 外 部 互联 。 


Oracle RAC 节点 0 
(Power 740) 


Oracle RAC 节点 1 
(Power 740) 


A INC PR 


共享 存储 
(V7000) 


图 2-1 某 汽 车 制造 商 ERP 系统 (基于 Oracle RAC) 


从 工作 负载 来 看 ， 对 数据 库 的 操作 主要 是 读 与 写 并 发 ， 读 写 比 平均 为 7:3， 平 常 并 发 连接 
为 500 个 ， 高 峰 时 达到 2000 个 左右 。 这 个 系统 的 负载 包括 下 面 三 种 : 

(1) 业务 流程 负载 : 供 业 务 人 员 使 用 ， 涵盖 了 供应 链 、 生 产 、 财 务 、 营 销 等 各 个 模块 ， 
这 些 模块 总 体 上 的 负载 以 事务 型 为 主 ， 这 对 数据 库 系 统 的 事务 吞吐 量 提 出 了 非常 高 的 要 求 。 

(2) 碍 询 分 析 类 负载 : 供 管理 人 员 使 用 ， 例 如 企业 运营 情况 查询 、 人 力 资源 管理 等 ， 这 
类 用 户 对 响应 时 间 有 严格 的 要 求 。 这 类 用 户 可 对 数据 进行 分 析 以 获得 透视 能 力 ， 并 在 此 基础 上 
采取 行动 。 用 户 可 以 访问 、 计 算 及 共享 信息 ， 以 便 跨 越 产品 、 市 场 、 职 权 、 流 程 、 时 期 和 情景 
等 进行 绩效 检查 、 质 量 评 判 以 及 因果 分 析 。 
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(3) 报表 类 负载 : 包括 月 报表 、 季 报表 、 半 年 报表 ， 年 报表 每 ， 通 常 在 每 个 时 间 单 位 的 
最 后 儿 天 进行 ， 例 如 月 报表 在 每 个 月 的 25 号 开始 ， 在 30 号 左右 完成 ， 这 对 生成 时 间 有 极 高 的 

这 个 ER 系统 是 分 期 上 线 的 , 刚 开 始 只 有 供应 链 、 和 生产 和 财务 模块 ， 后 来 逐渐 增加 了 营销 、 
人 力 资源 等 模块 ， 用 户 量 也 从 刚 开 始 的 平时 100 个 并 发 用 户 逐 渐 增 加 到 500 并 发 用 户 ， 高 峰 时 
可 以 达到 2000 左右 ; 数据 量 的 增加 更 为 显著 ， 从 上 线 初期 的 1TB 增加 到 现在 的 6TB， 由 于 写 负 
载 比较 频繁 ， 每 天 变化 的 数据 量 可 以 达到 2006 左右 。 这 样 一 来 ， 这 个 汽车 制造 商 ERP 应 用 的 
Oracle 数据 库 性 能 束 开 始 遇 到 了 瓶 贷 ， 系 统 资源 不 堪 重 负 ， 有 具体 表现 在 以 下 儿 个 方面 : 

(1) 业务 流程 管理 中 各 模块 包括 供应 链 、 生 产 、 财 务 、 营 销 和 人 力 资 源 等 需要 处 理 的 事 
务 量 越 来 越 多 ， 特 别 是 系统 索 忙 时 ， 已 经 接近 集群 对 事务 吞吐 量 的 设计 上 限 。 

(2) 分 析 三 询 性 能 出 现 了 问题 ， 投 照 设 计 ， 只 能 提供 按 天 或 者 投 月 的 售 询 ， 但 是 根据 动 
态 条 件 人 查询 上 存在 性 能 问题 ， 例 如 要 求 按 照 某 个 时 间 段 查询 ， 需 要 5 分 钟 以 上 的 时 间 才 能 访问 
结果 ， 而 前 问 的 应 用 远 辑 是 2 分 钟 数 据 库 没有 返回 络 末 融 认为 是 超时 了 。 

(3) 报表 应 用 也 存在 性 能 问题 。 目 前 生成 报表 的 时 间 在 30 个 小 时 左右 ， 随 独 数 据 量 的 不 
源 增 长 ， 这 个 时 间 还 在 逐渐 增加 。 从 性 能 角度 来 看 ， 应 该 寻找 一 种 不 完全 依赖 于 数据 量 的 方案 。 

需要 强调 的 是 ， 上 述 不 同 种 类 的 负载 出 现 性 能 问题 后 ， 会 出 现 严重 的 县 加 效应 ， 特 别 是 交 
易 型 的 流程 管理 和 分 析 型 的 日 常 查 询 、 报 表 类 应 用 在 执行 时 间 上 难以 避免 出 现 了 午 阁 ， 这 使 得 
2 8 FE ANTE TR fA o 

But. —^r 3E" SC T TERES E T xx ICE IEEE BRIT EIRE TA S A E Do ? 

2.1.2. TEBETLIC REA 7338: “NE” SETS 

上 一 节 ， 我 们 了 人 解 了 该 汽车 制造 丙 ERP 应 用 的 Oracle RAC 44538 S0 J HERE, 3X 78 
我 们 谈 谈 针对 这 个 问题 的 解决 办 法 。 

在 第 一 章 讲 过 成 本 效益 分 析 ， 这 个 策略 是 用 来 找到 成 本 和 性 能 的 最 佳 平衡 点 的 。 性 能 优化 
并 不 意味 看 片面 退 求 性 能 的 最 大 化 ， 因 为 优化 是 无 止境 的 ， 必 须根 据 业 务 害 求 找到 真正 的 痛 点 
所 在 ， 其 实 ， 这 个 问题 最 大 的 痛 点 是 ERP 应 用 的 不 同 负 载 的 登 加 导致 的 ， 谈 起 这 个 问题 ， 很 多 
该 者 可 能 会 目 然 想到 下 面 的 两 种 办 法 : 

第 一 种 办 法 ， 立 足 于 目前 的 软 人 硬件 条 件 ， 对 Oracle RAC 数据 库 集群 进行 优化 。 通 常 的 步 
又 是 ， 首 先 对 操作 系统 和 数据 库 进 行 监控 ， 随 后 调整 参数 ， 调 整 物 理 设 计 ， 调 整 馆 辑 议 计 诸如 
索引 、 表 分 区 、 临 时 表 等 技术 ， 最 后 再 进行 性 能 验证 。 这 种 办 法 的 优点 是 不 需要 对 数据 库 进 行 
大 的 架构 调整 焉 能 实现 ， 但 是 ， 缺 点 也 很 明显 ， 这 种 办 法 依赖 于 优化 人 员 的 经 验 和 技术 水 平 ， 
通常 只 对 局 部 应 用 优化 有 帮助 ， 对 整体 性 能 往往 无 能 为 力 ， 所 以 是 一 种 权宜 之 计 。 男 外 ， 有 时 
候 也 会 出 现 投 入 产 出 不 成 正比 的 问题 ， 投 入 足够 多 的 人 力 ， 但 是 优化 效果 却 不 尽 如 人 意 。 

第 二 种 办 法 ， 便 件 扩容 的 方式 。 具 体 来 说 ， 束 是 将 集群 从 2 个 市 点 扩充 为 4 个 市 点 来 提升 
系统 的 处 理 能 力 。 这 种 办 法 的 优势 是 可 以 非常 明显 地 提升 系统 的 事务 否 吐 能 力 ， 也 能 提升 ERP 
应 用 中 某 些 模块 的 性 能 。 但 是 ， 运 行 Oracle RAC 的 Power 740 服务 器 将 从 2 台 变 为 4 台 ， 而 
Power 740 价格 相对 较 高 ， 这 超过 了 该 汽车 制造 商 的 便 件 了 预算。 最 重要 的 是 Oracle RAC 的 强项 
在 于 高 可 用 性 和 负载 均衡 ， 但 是 扩展 能 力 不 是 线性 的 ， 另 外 设计 上 也 需要 进行 必要 的 改造 ， 例 
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如 对 一 些 热点 表 进 行 hash 分 区 或 者 范围 分 区 ， 人 否则 数据 在 多 个 节点 之 间 多 次 传递 影响 性 能 。 

那么 , 还 有 没有 更 好 的 办 法 呢 ? 本 章 将 同 读 者 介绍 一 种 分 布 式 架构 方案 , 即 对 便 件 “分 库 ” 
的 解决 方案 ， 上 基体 来 说 ， 束 古 根 据 应 用 负载 的 不 同 而 将 单一 的 数据 库 分 解 成 同 构 或 者 弄 构 的 数 
据 库 。 


比较 : 集中 式 架 构 和 分 布 式 架 构 

数据 库 架 构 分 为 集中 式 和 分 布 式 。 单 机 版 的 DB2 以 及 DB2 PureScale 集群 都 属于 集中 式 
的 。 分 布 式 架构 的 产品 和 技术 很 多 ， 例 如 异 构 数 据 库 实时 复制 产品 IBM CDC、 灾 备 技术 DB2 
HADR 等 。 


在 本 客户 案例 中 ， 可 以 按照 不 同 的 负载 方式 对 这 个 ERP 应 用 进行 “分 库 ” 处 理 : 上 面谈 到 
供应 链 、 和 生产、 财务 、 营 销 等 业务 模块 ， 他 们 的 负载 特 扣 是 事务 型 的 ， 以 写 为 主 ， 所 以 这 些 应 
用 运行 在 一 个 独立 的 数据 库 中 ;， 另 外 一 种 是 分 析 碍 询 和 报表 ， 包 括 上 面谈 到 的 分 析 企 业 运 宫 情 
况 、 人 力 资 源 管理 等 ， 这 些 负 和 载 的 特点 是 分 析 型 的 ， 以 读 为 主 ， 这 些 应 用 运行 在 为 外 的 数据 库 
中 。 这 样 “分 库 ” 之 后 带 来 的 好 处 是 可 以 实现 读 写 分 离 ， 风 辑 上 也 更 加 清晰 ， 能 从 染 构 上 非 第 
明显 地 拓 升 系统 性 能 。 
4 注意 : 架构 与 性 能 

数据 库 架构 规划 和 设计 应 该 满足 短期 、 中 期 和 长 期 的 性 能 需求 ， 但 是 由 于 业务 的 快 

速 发 展 ， 迟 早 有 一 天 会 产生 性 能 问题 ， 这 样 将 会 对 数据 库 架 构 提 出 严重 挑战 ， 从 而 促使 

架构 不 得 不 与 时 俱 地 进 持 续 改 变 ， 以 再 次 满足 业务 的 性 能 需求 。 


图 2-2 是 对 事务 型 负载 和 分 析 型 负载 “分 库 ” 后 的 架构 网 : Oracle RAC 集群 还 是 基于 原 有 
的 硬件 环境 ， 不 过 进行 了 “瘦身 ”处 理 ， 上 只 用 来 运行 事务 型 负载 ， 包 括 供应 链 、 和 生产、 财务 等 
考虑 到 DB2 数据 库 在 运行 分 析 型 负载 的 性 能 优势 ， 所 以 选择 了 异 构 的 DB2 数据 库 来 运行 分 析 
型 应 用 ， 包 括 分 析 企 业 运 营 情 况 、 人 力 资源 管理 等 ， 运 行 DB2 的 硬件 选择 性 价 比 更 高 的 x3850 
服务 器 ， 操 作 系统 为 Redhat Linux， 配 置 了 64 个 CPU 内 核 256GB 内 存 。 
公 网 交换 机 
AS 


ERP 分 析 型 负载 


Oracle RAC 节点 1 
(Power 740) 


Oracle DB2-35 r 


(x3850) 


HTAA 
(V7000) 


图 2-2 “分 库 ” 后 的 架构 图 
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按照 上 述 方式 “分 库 ” 后 ,产生 了 新 的 问题 。 因 为 分 析 型 负载 应 用 需要 基于 和 ERP 事务 型 
负载 应 用 逻辑 上 一 致 的 数据 ， 换 句 话 说， 要 解决 好 下 面 的 两 个 问题 : 
(1) 目前 Oracle 数据 库 中 的 数据 量 已 经 达到 了 8TB， 那 么 如 何 将 这 样 一 个 TB 级 的 数据 
初始 化 到 DB2 数据 库 中 ? 
(2) 数据 初始 化 后 ， 如 何 保证 Oracle 源 数 据 库 和 DB2 目标 数据 库 之 间 保 持 数 据 实 时 同步 ? 
经 过 探讨 ， 解 决 上 述 问 题 的 办 法 是 借助 其 他 数据 整合 工具 来 完成 ，TB 级 的 数据 初始 化 需 
要 借助 ETL 工具 ,例如 IBM Datastage 或 者 Oracle ODI; 数据 库 之 间 实 时 复制 需要 借助 IBM CDC 
或 者 Oracle GoldenGate。 于 是 ， 分 别 对 这 两 套 工 具 进 行 了 技术 验证 (Proof Of Concept) 。 


比较 : IBM Datastage 和 Oracle ODI 


验证 结果 表明 ， 从 Oracle 到 DB2 迁移 同样 规模 的 数据 ，IBM Datastage 可 以 实现 平均 10 
万 条 / 秒 以 上 记录 的 迁移 ， 而 Oracle ODI 只 能 达到 5 万 条 / 秒 。 


比较 : IBM CDC 和 Oracle GoldenGate 


IBM CDC 在 安 爱 的 简便 性 及 图 形 化 界面 操作 方面 ， 要 比 Oracle GoldenGate 好 很 多 , 而 且 
当 目 标 端 是 DB2， 并 且 需 要 每 天 同步 200G 以 上 变化 数据 时 ，IBM CDC 表现 出 非常 高 的 可 靠 
性 和 性 能 。 


最 终 ， 该 汽车 制造 商 选 择 了 IBM Datastage 工具 实现 从 Oracle 到 DB2 之 间 的 数据 初始 化 ， 
选择 了 IBM CDC 来 实现 Oracle 和 DB2 之 间 实 时 同步 。 


2.1.3 高 可 用 解决 方案 : DB2 HADR 


上 一 节 我 们 提出 了 一 种 针对 不 同 负 载 “分 库 ” 的 方案 来 解决 Oracle RAC 集群 的 性 能 问题 ， 
其 中 引入 了 DB2 节点 来 分 担 (Off Load) 分 析 查 询 类 负载 。 但 是 ， 这 个 汽车 制造 商 并 没有 满足 
于 此 ， 而 是 提出 了 一 个 这 样 的 问题 : 当初 选择 Oracle RAC 就 是 为 了 实现 高 可 用 性 ， 以 满足 数据 
库 系统 7X24 小 时 不 间断 运行 的 需要 ， 而 企业 运营 情况 查询 、 人 力 资源 管理 等 查询 分 析 业 务 ， 
也 需要 高 可 用 和 灾 备 方案 ， 那 么 在 DB2 中 如 何 实现 呢 ? 答案 是 “DB2 HADR”。 

可 能 很 多 读者 第 一 次 听 到 DB2 HADR 这 个 名 字 ， 那 么 什么 是 DB2 HADR WE? 它 是 DB2 
High Availability Disaster Recovery 的 英文 缩写 ， 如 图 2-3 所 示 ， 它 是 一 种 实现 高 可 用 性 和 灾难 
恢复 的 解决 方案 。DB2 HADR 由 主 数据 库 和 从 数据 库 组 成 。 主 数据 库 接 收 和 连接 并 且 执 行事 务 ， 
将 生成 的 日 志 实 时 地 发 送 至 从 数据 库 ; 从 数据 库 将 主 数据 库 发 送 过 来 的 日 六 进行 重 做 ， 从 而 完 
成 与 主 数据 的 同步 。 当 主 数据 库 出 现 问 题 不 能 正常 工作 时 ， 从 数据 库 可 以 快速 接管 主 数据 库 的 
功能 ，DBA 可 用 选择 手工 接管 或 者 上 自动 接管 。 
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_ 主 数据 库 


receiver) 


图 2-3 DB2 HADR 原理 


比较 : DB2 HADR 的 四 种 同步 模式 


DB2 HADR 支持 四 种 同步 模式 : 同步 、 近 同步 、 异 步 和 超级 异步 。 四 种 同步 模式 对 网 络 的 
要 求 和 对 主 数 据 库 的 影响 依次 减 小 ， 但 是 可 靠 性 也 依次 降低 。 例 如 ， 同 步 模式 对 主 数据 库 上 的 
事务 影响 最 大 ， 但 是 可 以 保证 从 数据 库 上 的 事务 和 主 数据 库 是 实时 一 致 的 ; 而 超级 异步 模式 对 
主 数据 库 上 的 事务 没有 任何 影响 ， 但 是 一 旦 主 数据 库 出 现 事故 ， 就 可 能 会 发 生 事务 丢失 。 


引入 DB2 HADR 后 ， 最 终 经 营 分 析 库 如 图 2-4 所 示 ， 包 括 DB2 主 节 点 和 从 节点 ， 服 务 器 
都 为 性 价 比 极 高 的 x3850 服务 器 ，64 个 内 核 ，256GB 内 存 。 为 了 真正 确保 高 可 用 性 ，DB2 x 
点 和 从 节点 是 路 机 房 部 普 的 ， 其 中 主 布点 部 着 在 北京 大 兴 机 房 ， 从 和 点 部 普 在 北京 亦庄 机 房 ， 
两 个 市 点 之 间 通 过 VPN 网 络 连接 ， 选 择 近 同 步 工 作 模式 。 

为 了 使 用 好 DB2 HADR， 还 需要 在 客户 端 配置 目 动 客户 姗 重新 路 由 CAutomatic Client 
Reroute， 缩 写 为 ACRO 功能 ， 这 样 当 主 节 点 和 从 节点 之 间 发 生 故 隐 切 换 时 ， 可 以 将 ERP 查询 
分 析 应 用 目 动 路 由 到 从 节点 上 ， 这 可 以 最 大 限度 地 减少 中 断 时 间 。 

公 网 交换 机 日 动 客 户 端 重新 路 由 
Oy Om | 


FS | 
ERP 事务 型 负载 ERP 分 析 型 负载 


初始 化 数据 (Datastage) 


HADR 
| 
实时 同步 CDC) [] 
Oracle RAC 节点 0 Oracle RAC 节点 1 DB2 主 节点 DB2 从 节点 
(Power 740) (Power 740) (x3850) (x3850) 


共享 存储 
CV7000) 


图 2-4 引入 DB2 HADR 后 的 架构 图 


从 DB2 V9.7 开始 ，DB2 HADR JF Sc EA B ein] i (Read On Standby) WH e, H H 
以 将 一 些 读 操作 集中 在 从 节点 上 运行 ， 以 减轻 主机 的 负载 。 另 外 ， 从 DB2 VIO 开始 支持 3 个 从 


INO 
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在 这 个 ERP 案例 中 ，DB2 HADR 的 优势 可 以 得 以 利用 : 配置 、 使 用 和 省 理 非 第 简单 ， 近 
司 步 模 式 的 管理 非 党 有效， 丢失 数据 的 可 能 性 非常 小 ， 主 节点 和 从 节点 之 间 上 只 传输 日 六， 节省 
了 网 络 上 的 开销 ; 主 从 数据 库 的 数据 几乎 实时 同步 ， 接 管 的 速度 也 非常 快 ， 极 大 地 减轻 了 数据 
库 管 理 员 的 工作 。 


2.2 实施: 经 营 分 析 库 


这 一 节 将 从 性 能 的 角度 谈 谈 基于 DB2 的 经 营 分 析 库 的 实施 过 程 ,将 分 享 实施 中 务必 重视 的 
物理 设计 、 逻 辑 设 计 、 参 数 配 置 等 ， 这 将 为 后 续 的 性 能 优化 打下 坚实 的 基础 。 这 次 实施 ， 选 择 
了 DB2 V9.7 FP5 作为 安装 介质 ， 这 是 一 个 可 靠 和 稳定 的 版 本 。 


2.2.1 DB2 数据 库 安装 


DB2 安 状 程序 提供 三 种 方式 用 以 安 疾 DB2 数据 库 软 件 。 一 种 是 岁 形 化 界面 方式 ， 一 种 是 
命令 行 方式 ， 夯 一 种 是 静默 安装 方式 。 每 种 安 儿 方 式 ， 都 有 适合 的 场景 和 特点 。 例 如 ， 网 形 化 
界面 的 安 北方 式 , 适合 习惯 使 用 界面 交互 方式 的 用 户 使 用 ; 命令 行 安 装 方式 , 适合 具备 一 定 DB2 
使 用 经 验 的 用 户 ， 在 无 法 使 用 图 形 界面 的 环境 中 轻松 安装 DB2 AIER ARIA, W 
个 安装 过 程 无 须 人 工 干 预 ， 通 过 啊 应 文件 的 方式 ， 可 以 方便 用 户 在 多 台 服 务 占 上 ， 同 时 安装 相 
同 配置 的 DB2 数据 库 软件 。 

本 次 实施 中 , 该 汽车 制造 商 客 尸 出 于 安全 方面 的 考虑 , 为 外 也 为 了 避免 消耗 不 必要 的 资源 ， 
茶 止 使 用 图 形 界面 ， 所 以 我 们 只 能 使 用 命令 行 方式 安 逆 ， 这 种 安 猴 方式 ， 其 实 也 很 方便 、 快 捷 。 
接 下 来 ， 介 绍 一 下 整个 安装 过 程 。 


1. 创建 用 户 和 组 


按照 DB2 的 安装 要 求 , WE 2-1 所 示 , 一 共 规 划 了 三 个 组 , erpiadm1〈 实 例 用 户 组 )、erpfadml 
《防护 用 户 组 ) 和 dasadm1〔 管 理 服务 器 用 户 组 ) ， 这 三 个 组 中 分 别 包 括 三 个 用 户 , 分 别 为 erpinstl 
《实例 用 户 ) 、erpfencl (WIHA) 和 dasur! (管理 服务 器 用 户 )。 需 要 注意 的 是 ， 在 创建 上 述 
组 和 用 户 时 ， 和 需要 显示 指定 组 ID 和 用 户 ID， 这 是 因为 搭建 DB2 HADR 环境 时 ， 要 求 主 六 点 和 从 
节点 相应 的 组 ID 和 用 户 ID 完全 一 致 。 关 于 DB2 HADR 双 机 的 实施 ， 可 参见 2.3 节 有 关内 容 。 


Aa 注意 : DB2 管理 服务 器 已 不 推荐 使 朋 
DB2 管理 服务 器 ( DB2 Administrative Server， 缩 写 为 DAS) 从 DB2 V9.7 开始 已 
不 推荐 使 用 ， 所 以 相应 的 dasadml 和 dasusrl 不 是 必须 要 创建 的 。 


表 2-1 用 户 和 组 规划 表 
用 户 各 /组 名 | p | 分 类 | —— BR | Hi 
erpiadml [eo | 组 |- | SH 
erpfadmi [e a |- — [nra 


26 


第 2 章 Zautemmxb5i um 


CEK) 
用 户 名 /组 名 | go | 分 类 | RBR Ris 
dasadmnl w | 组 [|- | 管理 服务 器 用 户 组 
einst | e | W^ | /ab2homejerpinstl | SMM 
apfenc i" 


dasusrl 602 /db2home/dasusr1 管理 服务 占用 户 


下 面 是 在 Redhat Linux 上 创建 组 、 用 户 和 设置 用 户 密 码 的 命令 : 
(1) 创建 组 


groupadd -g 600 erpiadml 
groupadd -g 601 erpfadml 
groupadd -g 602 dasadml 


(2) 创建 用 户 ， 并 指派 用 户 组 


useradd -u 600 -g erpiadml “m -d /db2home/erpinstl erprnsti 
userdde =u 601 =g erpfacmi =m c Acl» meme Aene eT cei 
useradd -u 602 -g dasadml -m -d /db2home/dasusrl dasusrl1 


以 上 述 第 一 条 useradd 命令 为 例 ，-g 指定 了 用 户 的 初始 组 Cinitial group) ; -m 指定 了 如 果 
用 户 目录 不 存在 ， 将 目 动 创建 ; -qd 指定 了 用 户 根 目录 ; erpinstl 是 创建 的 实例 用 户 名 ，erpfencl 
是 创建 的 防护 用 户 名 ，dasusrl 是 创建 的 管理 服务 器 用 户 名 。 

(3) REH P ERG 


passwd erpinstl 
passwd erpfencl 


passwd dasusrl 

2. 正式 安装 

把 DB2 安装 介质 拷贝 到 X3850 目标 机 上 右上， 进入 DB2 安 猜 介质 存放 路 径 ， 运 行 脚 本 
db2 install， 看 到 选择 安装 目录 的 命令 提示 ， 采 用 默认 路 径 /opVibm/db2/V9.7。 输 入 “ESE”， 
按 回 车 键 ， 安 装 DB2 企业 服务 器 版 。 安 装 程序 显示 开始 初始 化 DB2 安装 过 程 ， 并 提示 共有 47 
个 任务 需要 执行 以 及 所 需 的 时 间 ， 等 待 一 会 儿 ， 安 装 任务 结束 。 

呵呵 ， 稍 安 地 躁 ! 到 现在 为 止 ， 仅 完成 了 将 DB2 的 安装 文件 拷贝 到 服务 器 上 ， 还 需要 进行 
操作 系统 参数 配置 、 实 例 创 建 和 配置 、 数 据 库 创 建 和 配置 等 操作 。 


2.2.2 操作 系统 参数 配置 
1. 修改 sysctl.conf 内 核 参 数 文 件 


编辑 /etc/sysctl.conf 文件 来 修改 必须 调整 的 内 核 参 数 。 如 果 此 文件 不 存在 ， 那 么 应 创建 它 。 


tC/ cee a e e HE 

-- 下 面 是 内 存 为 16GB 的 配置 例子 

-- 如 果 内 存 多 于 16GB, SEMMSL、SEMMNS、SEMOPM、msgmax 和 msgmnpb 保持 不 变 

-- 但 是 ，shmmni、shmmax、shmal1、SEMMNI 和 msgmni 的 设置 成 比例 增 大 ， 见 下 面 加 黑 内 容 : 
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kernel.shmmni-4096 

kernel.shmmax-17179869184 

kernel.shmall-8388608 

--kernel.sem-«SEMMSL» «SEMMNS» «SEMOPM» <SEMMNI> 
kernel.sem-250 256000 32 4096 
kernel.msgmni-16384 

kernel.msgmax-65536 

kernel.msgmnb-265536 


x3850 服务 器 拥有 256GB 内 存 ， 是 16GB 的 16 1%, shmmni. shmmax. shmall. SEMMNI 
和 msgmni 的 设置 应 成 比例 增 大 ， 最 终 内 核 参 数 的 配置 如 下 : 


HC vete eu ASIE ILS 

-- WE 256GB 

kernel.shmmni-65536 

kernel.shmmax-274877906944 
kernel.shmall-134217728 

--kernel.sem-«SEMMSL» «SEMMNS» «SEMOPM» «SEMMNI-» 
kernel.sem-250 256000 32 65536 
kernel.msgmni-262144 

kernel.msgmax-65536 

kernel.msgmnb-265536 


运行 sysctl 时 附带 -p 参数 ， 以 便 从 缺 省 文件 /etc/sysctlconf PIA sysctl 设置 : 


# sysctl -p 


运行 ipcs -1 命令 以 显示 当前 的 内 核 参 数 设置 。 

4 ipcs ll 
wi Shared) Memory Limits ======== 
max number of segments = 65536 // SHMMNI 
max seg size (kbytes) = 274877906944 // SHMMAX 
max total shared memory (kbytes) = 134217728 // SHMALL 
min seg size (bytes) = 1 
ccu Semaphore T pm SE 
max number of arrays = 65536 // SEMMNI 
max semaphores per array - 250 // SEMMSL 
max semaphores system wide - 256000 // SEMMNS 
max ops per semop call - 32 // SEMOPM 
semaphore max value = 6065536 
二 一 一 一 一 一 Messages; Limits =======-= 
max queues system wide = 262144 // MSGMNI 
max size of message (bytes) = 65536 // MSGMAX 
default max size of queue (bytes) = 65536 // MSGMNB 


2. 修改 limits.conf 文件 


编辑 limits.conf 文件 ， 针 对 用 户 erpinstl 修改 进程 的 最 大 数目 Cnproc) 、 打 开 文 件 的 最 大 
数目 Cnofile) 、 了 最 大 栈 大 小 〈stack) 、 最 大 数据 大 小 (data) 、 了 最 大 文件 大 小 〈fsize) 的 软 限 
BAIER t, RAAS x3850 服务 器 设置 了 如 下 参数 : 


i Cat /ete/security/limits conf e 
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erpinstl softe peces 2047 
erpinst1 hard nproc 16384 
erpinst1 soft nofile 4096 
erpinstli hard nofile 65536 
erpinstl1 soft stack 10240 
-- -1 表示 最 大 数据 大 小 没有 限制 
erpinstl1 hard data -1 

-- -1 a a BRE Tol 


erpinsti hac fsize =1 


3. 修改 /etc/hosts 文件 


实施 中 会 用 到 两 台 xasso 服务 器， 其 中 主 节 点 IP 地 址 为 “10.2.3.1”， 域 名 为 
“PrimaryNode-1”， 从 节点 IP 地 址 为 “10.2.3.2”， 域 名 为 “StandbyNode-1”， 如 下 所 示 : 


= Cat /erce/hosts 


deer T localhost.localdomarcrn localkthiost 
T0.2.3.F PrimaryNode-1 
10.2.3.2 StandbyNode-1 


2.2.3 ”实例 创建 与 配置 


完成 安装 和 操作 系统 参数 设置 后 ， 接 下 来 规划 数据 库 实例 。 如 表 2-2 所 示 ， 数 据 库 实例 名 
和 实例 用 户 名 相同 ， 名 为 erpinst1， 实 例 的 根 目 录 为 /db2home/erpinstl/sqllib; Pj O 5 WAN 
50001， 下 面 将 讲述 如 何在 /etc/services 文件 中 配置 端口 号 ，SVCENAME 设置 为 db2c erpinstl, 
下 面 将 讲述 如 何在 DBM CFG 中 配置 。 


表 2-2 数据 库 实例 规划 


数据 库 实例 名 erpinst1 
m O 50001 
TR H 3i /db2home/erpinst1 /sgllib 
SVCENAME db2c erpinstl 


1. 创建 DB2 管理 服务 器 (可 选 ) 


如 果 在 2.2.1 闻 没 有 创建 组 dasadml 和 用 户 dasusrl 的 话 ， 就 不 需要 再 创建 DB2 管理 服务 
器 了 ， 所 以 这 个 步骤 可 以 省 略 。 

如 果 和 需要 创建 的 话 ， 那 么 使 用 root 用 户 ， 执 行 命令 dascrt， 如 果 DB2 安装 在 默认 路 径 中 ， 
该 命令 的 全 路 径 为 /opt/ibm/db2/V9.7/instance/dascrt， 如 下 所 示 : 


/opt/ibm/db2/V9.7/instance/dascrt -u dasusrl1 
SOL4406W The DB2 Administration Server was started successfully. 
DBILO70I Program cascrt cComplercec successfully., 


2. 创建 DB2 实例 


使 用 root 用 户 ， 执 行 命令 db2icrt, WR DB2 安 儿 在 默认 路 径 中 ， 该 命令 的 全 路 径 为 
/opt/ibm/db2/V9.7/instance/db2icrt， 如 下 所 示 : 
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/opt/ibm/db2/V9.7/instance/db2icrt -a server -u erpfencl erpinstl 
DBILO70I Program clo2icrt completed) successfully., 


其 中 ,-a IE T SSPLX HR 9 AFC served AERAN; -u 指定 了 受 防 护 用 户 erpfencl;erpinstl 
是 创建 的 实例 名 。 
只 有 在 DB2 服务 嚣 端 配置 了 TCP/IP 通信 协议 , DB2 服务 器 才能 接受 来 自 DB2 客户 端的 请 
求 ， 因 此 需要 做 下 面 的 工作 : 
(1) 使 用 root 用户， 在 操作 系统 的 TCP/IP 服务 文件 〈/etc/services) 中 指定 服务 右 的 监听 
端口 50001， 内 容 如 下 : 


db2c erpinstl1l 50001/tcp # DB2 connection service port 


(2) 使 用 DB2 实例 用 户 erpinstl, 为 数据 库 管理 器 配置 参数 SVCENAME 赋值 ,命令 如 下 : 


db2 update dbm cfg using SVCENAME db2c erpinstl 
DB20000I The UPDATE DATABASE MANAGER CONFIGURATION command completed successfully. 


(3) 使 用 DB2 实例 用 户 db2inst1， 设 置 通信 代理 。 


OK! 大 功 告 成 ! 
2.2.4 存储 规划 与 文件 系统 创建 


在 本 次 实施 过 程 中 , 文件 系统 规划 如 表 2-3 HR, 其 中 db2home 使 用 X3850 的 内 置 盘 存放 
实例 数据 。 文 件 系统 db2fsl. db2fs2 和 db2fs3 使 用 外 挂 磁盘 用 于 存放 数据 ， 其 大 小 完全 一 致 ， 
底层 物理 规划 也 一 样 ， 即 使 用 2 个 RAID 5 AHA, A RAD HA DHP) ， 每 块 盘 大 小 为 
300G. db2log 也 使 用 外 挂 磁 盘存 放 数 据 库 日 志 ， 底 层 规划 为 1 个 (3D+1IP) 的 RAID 5 2H. 
这 样 承 可 以 达到 数据 和 日 志 物 理 隔 离 的 目的 ， 从 而 提高 数据 库 的 LO 性 能 。 


表 2-3 文件 系统 规划 
文件 系统 挂 载 点 容量 磁盘 
db2home /db2home 实例 数据 PEE 


db2fs1 /db2fs1 数据 单个 物理 盘 为 300G, 
2 个 RAID 5 盘 组 ， 
每 个 盘 组 为 〈4D+1P ) 
db2fs2 /db2fs2 2.4 TB 数据 单个 物理 盘 为 300G, 
每 个 盘 组 为 〈4D+1P ) 
db2fs3 /db2fs3 2.4 TB 数据 单个 物理 盘 为 300G, 
每 个 盘 组 为 〈4D+1P ) 
db2log /db2log 900 GB Hx ANRA 300G, 
Id 1 ^^ RAID 5 H, 
每 个 盘 组 为 〈3D+1P) 
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这 个 案例 使 用 LVM (Logical Volume Manager) 来 管理 磁盘 阵列 。 那 么 什么 是 LVM 呢 ? 
LVM 是 对 磁盘 分 区 进行 管理 的 一 种 机 制 , 它 是 建立 在 便 盘 之 上 的 一 个 逻辑 层 , 用 于 提高 磁盘 管 
理 的 灵活 性 。 

便 盘 分 区 是 LVM 的 基本 存储 届 辑 块 ， 称 为 物理 卷 (Physical Volume， 人 简称 PV) o AFA 
PV 组 成 一 个 整 块 的 卷 组 (Volume Group, WPK VG) ， 形 成 一 个 存储 和 池 。 管 理 员 可 以 在 VG 上 
随意 创建 逻辑 卷 (Logical Volumes, WEK LV) ， 并 进一步 在 逻辑 卷 上 创建 文件 系统 。 创 建文 
件 系 统 db2fsl 的 过 程 如 下 ,其 中 /dev/sdc 和 /dev/sdd 对 应 的 是 存储 映射 过 来 的 两 个 RAID 5 dH. 
使 用 “pvcreate” 命 令 在 它们 上 和 面 分 别 创建 物理 卷 ， 然 后 使 用 “vgcreate” 命 令 创建 fslvg 卷 组 ， 
包括 物理 卷 /dev/sdce， 再 使 用 “vgextend” 命 令 把 物理 大 /dev/sdd 也 加 入 到 fslvg 卷 组 中 ; 最 后 使 
用 “1lvcreate” 命 令 在 卷 组 fslvg 上 创建 大 小 为 2400GB， 也 束 是 2.4TB MEHE fsllv。 

完成 逻辑 卷 fsllv 的 创建 后 ,使 用 mkfs.ext4 在 其 上 创建 ext4 格式 的 文件 系统 ， 随 后 按照 表 
2-3 的 规划 ， 再 用 mount 命令 挂 载 ， 挂 载 点 为 /db2fs1。 


pvcreate /dev/sdd 

pvcreate /dev/sdd 

vgcreate fslvg /dev/sdc 

vgextend fslvg /dev/sdd 

lycreate -L 24006 =m fsily ce SUE] 
mkfs.ext4 /dev/fslvg/fsllv 

discus aosel 

mount /dey/£fslvg/fsilly /db2fe1 


用 类 似 的 办 法 , 在 RAID 5 3X 2H/dev/sde 和 /dev/sdf 上 创建 文件 系统 db2fs2, 大 小 也 为 2.4TB 
左右 ， 挂 载 点 为 /db2fs2， 命 令 如 下 : 


pvcreate /dev/sde 

pvcreate /dev/sdf 

vgcreate fs2vg /dev/sde 

vgextend fs2vg /dev/sdf 

lycereate -L 24006 =m as t2 der fs2yg 
mkfs.ext4 /dev/fs2vg/fs2lv 
Ce 
Wounded AID M 


用 类 似 的 办 法 , 在 RAID 5 Æ 2H/dev/sdg 和 /dewsdh 上 创建 文件 系统 db2fs3 , 大 小 也 为 2.4TB 
左右 ， 挂 载 点 为 /db2fs3， 命 令 如 下 : 


pvcreate /dev/sdg 

pvcreate /dev/sdh 

vgcreate fs3vg /dev/sdg 

vgextend fs3vg /dev/sdh 

lyecreate =L 24006 noc s.31 ws 9 
mkis ext4 Ade AES s 

mkair n elei as Srl 

mount /dev/fs3vg/fs3lv /db2fs3 


HIJINA, Œ RAID 5 4E 2H/dev/sdi 上 创建 文件 系统 db2log， 大 小 为 900GB， 挂 载 点 为 
/db2l1og， 命 令 如 下 : 
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pvcreate /dev/sdi 

oe Te owl de /eo 
lyereate =L 900G =n logly logvg 
mkfs.ext4 /dev/logvg/loglv 
mkdir /db2log 

mount /cdevy/logvg/logly /oo521c6 


为 了 方便 每 次 系统 重启 后 ， 文 件 系统 db2fs1, db2fs2. db2fs3 和 db2log 能 够 自动 挂 载 ， 可 
以 在 /etc/fstab 文件 的 末尾 加 入 下 面 的 黑体 语句 ， 这 样 对 DBA RK, MIES T. 


= Cat /ete/fstab 


devpts /dev/pts devpts mode-0620,gid-5 0 0 

proc eeie péoce defaults 0 0 

sysfs / sys sysfs  noauto 0 0 

debugfs /sys/kernel/debug debugfs noauto 0 0 

usbfs /proc/bus/usb usbfs | noauto 0 0 
/dev/fslvg/fsllv /db2fs1 ext4 acl,user_xattr l1 
/dev/fs2vg/fs21v /db2fs2 ext4 acl,user xattr 1 1 
/dev/fs3vg/fs31lv /db2fs3 ext4 acl,user xattr 11 
/dev/logvg/loglv /db21og ext4 acl,user xattr 11 


2.2.5 ”数据 库 创建 


1. 数据 库 规划 


这 个 汽车 制造 商 的 DB2 经 营 分 析 库 的 名 字 为 erpdb, 字 符 集 选 择 UTF-8, 默认 页 大 小 为 32K. 
这 样 就 和 Oracle 数据 库 的 字符 集 和 默认 页 大 小 完全 一 致 了 。 

如 表 2-4 所 示 ， 绥 冲 池 的 规划 是 按照 应 用 来 确定 的 。 这 个 数据 库 主要 运行 人 力 资 源 管理 、 
分 析 三 询 和 报表 三 个 应 用 ， 上 所 以 为 这 三 个 应 用 目 定 义 三 个 独立 的 绥 冲 池 ; 另外 ， 为 了 方便 管理 
和 逻辑 清晰 ， 数 据 和 索引 使 用 不 同 的 缓冲 池 。 


Aa 小 技巧 ， 如 何 选择 页 大 小 

对 于 执行 随机 更 新 操作 的 OLTP 应 用 ， 采 用 较 小 的 页 面 例 如 8K 或 者 16K 更 好 ， 这 

样 可 以 提高 并 发 能 力 ， 因 为 较 小 的 页 面 消 耗 的 缓冲 池 空 间 小 ; 对 于 要 一 次 访问 大 量 连续 

记录 的 OLAP 或 者 DSS 应 用 ， 采 用 较 大 的 页 面 例 如 16K 或 者 32K 性 能 更 好 ， 这 样 读 取 
特定 数量 的 记录 时 发 出 的 1/O 请 求 会 更 少 。 


最 终 的 规划 是 这 样 的 ， 数据 缓冲 池 HR_DBP 和 索引 缓冲 池 HR IBP 为 人 力 资源 模块 使 用 ， 
由 于 人 力 资 源 模块 对 数据 库 的 访问 以 随机 访问 为 主 ， 它 们 的 页 大 小 都 规划 是 8KB; 数据 缓冲 池 
QRY DBP MRY RIE QRY_IBP 为 分 析 碍 询 模块 使 用 , 由 于 分 析 伍 询 模块 对 数据 库 的 访问 既 
有 随机 访问 ， 也 有 大 片 连 续 访 问 ， 它 们 的 页 大 小 规划 为 16K; 数据 绥 冲 池 RPT_DBP 和 索引 绥 
冲 池 RPT IBP 为 报表 模块 使 用 ， 由 于 报表 模块 对 数据 库 的 访问 以 大 片 连续 访问 为 主 , 它们 的 页 
大 小 规划 为 32K。 这 6 个 缓冲 池 都 暂时 规划 为 内 存 自动 调整 。 
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数据 库 名 学 erpinst 

字符 集 默认 页 大 小 32K 
缓冲 池 

"TT 页 大 小 m 

HR DBP 8K 人 力 资源 模块 数据 绥 冲 池 

HR_IBP True 人 力 资源 模块 索引 缓冲 池 

QRY DBP 分 析 查 询 模 块 数据 缓冲 池 

QRY IBP 分 析 答 询 模块 索引 绥 冲 池 

RPT DBP True 报表 模块 数据 绥 冲 池 

RPT IBP 32K True 报表 模块 索引 绥 冲 池 
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表 2-4 erpdb 数据 库 规划 


表 空 间 (自动 存储 管理 ) 


表 空间 描述 
/db2fs l/erpinstl/NODE0000/ERPDB/T0000005/C0000000.LRG A JJ X 
HR DTS 8K /db2fs2/erpinstl/NODE0000/ERPDB/T0000005/C00000001.LRG | 源 数 据 
/db2fs3/erpinstl/NODE0000/ERPDB/TO000005/C00000002.LRG | ^R] 
/db2fs l/erpinstl/NODE0000/ERPDB/T0000006/C0000000.LRG A JJ X 
HR ITS 8K /db2fs2/erpinstl/NODE0000/ERPDB/T0000006/C00000001.LRG | WR 5| 
/db2fs3/erpinstl/NODE0000/ERPDB/TO0000006/C00000002.LRG | ^R] 
/db2fsl/erpinstl/NODE0000/ERPDB/TO000007/C0000000.LRG 4] Pr & 
QRY DTS 16K /db2fs2/erpinstl/NODE0000/ERPDB/T0000007/C00000001.LRG | 询 数 据 
/db2fs3/erpinstl/NODE0000/ERPDB/TO000007/C00000002.LRG | ^R] 
/db2fsl/erpinstlI/NODE0000/ERPDB/T0000008/C0000000.LRG 4] Pr & 
QRY ITS 16K /db2fs2/erpinstI/NODE0000/ERPDB/TO000008/C00000001.LRG | WR 5l 
/db2fs3/erpinstl/NODE0000/ERPDB/TO000008/C00000002.LRG | ^R] 
/db2fs l/erpinstl/NODE0000/ERPDB/T0000009/C0000000.LRG 报表 数 
RPT DTS 32K /db2fs2/erpinstl/NODE0000/ERPDB/T0000009/C00000001.LRG | $i K T 
/db2fs3/erpinstl/NODE0000/ERPDB/T0000009/C00000002.LRG | 间 
/db2fsl/erpinstl/NODE0000/ERPDB/T0000010/C0000000.LRG 报表 XR 
RPT ITS 32K /db2fs2/erpinstl/NODE0000/ERPDB/T0000010/C00000001.LRG | 5l © 
/db2fs3/erpinstl/NODE0000/ERPDB/T0000010/C00000002.LRG | 间 


规划 好 缓冲 池 后 ， 束 可 以 考虑 表 空 间 了 ， 实 际 上 表 空 间 也 是 按照 应 用 来 确定 的 。 从 表 2-4 
可 以 看 出 ， 人 力 资源 模块 包括 数据 表 空 间 HR DTS 和 索引 表 空 间 HR ITS， 和 所 使 用 的 缓冲 池 
HR DBP, HR IBP 的 页 大 小 一 样 ， 都 是 8K; 分 析 碍 询 模 块 包 括 数据 表 空 间 QRY_DTS 和 索引 
表 空 间 QRY ITS， 和 所 使 用 的 缓冲 池 QRY DBP, QRY IBP 的 页 大 小 一 样 ， 都 是 16K; 报表 模 
块 包括 数据 表 空 间 RPT DTS 和 索引 表 空 间 RPT ITS， 和 所 使 用 的 缓冲 池 RPT DBP、RPT IBP 
的 页 大 小 一 样 ， 都 是 32K。 
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为 了 方便 维护 和 管理 , 选择 了 DB2 V9.7 提供 的 表 衬 间 目 动 存储 管理 CAutomatic Storage? ， 
这 样 只 需要 提供 存储 路 径 (Storage Path) ， 具 体 的 容器 文件 就 可 以 由 DB2 目 己 来 管理 了 ， 例 如 
表 空 间 HR_DTS H —^^ 28 XCfE/db2fsl/erpinstl/NODE0000/ERPDB/T0000005/C0000000.LRG 
/db2fs2/erpinstl/NODE0000/ERPDB/T0000005/C00000001.LRG 和 /db2fs3/erpinstl/NODE0000/ 
ERPDB/T0000005/C00000002.LRG 都 是 由 DB2 来 创建 和 管理 的 。 


2. 创建 erpdb 数据 库 


从 DB2 V9.7 开始 提供 了 Oracle 羔 容 模式 ， 以 更 好 地 帮助 具有 Oracle 使 用 经 验 的 DBA 使 
用 和 维护 DB2。 基 于 这 个 考虑 ， 也 为 分 析 伍 询 库 打开 Oracle RARI, BENA Hh E: 
“DB2 COMPATIBILITY VECTOR=ORA”， 设 置 后 重新 启动 实例 。 

具体 的 命令 和 系统 返回 信息 如 下 : 

=> db2set DB2 COMPATIBILITY VECTOR=ORA 

=> db2stop 

SQOL1063N DB2STOP processing was successful. 


=> db2start 
SQL1063N DB2START processing was successful. 


随后 ， 创 建 数据 库 ERPDB。 命 令 如 下 所 示 ， 其 中 数据 库 别 名 为 erpdb2, automatic storage 
表示 局 用 表 空 间 的 目 动 存储 管理 ，codeset UTF-8 表示 使 用 UTF-8 编码 ，territory CN 表示 区 域 
为 中 国 ，pagesize 32 k 表示 erpdb 的 默认 页 大 小 为 32K。 


=> db2 create database erpdb automatic storage yes on /db2fsl, /db2fs2, /db2fs3 ALIAS 
erpdb2 using codeset UTF-8 territory CN pagesize 32 k 
DB20000I The CREATE DATABASE command completed successfully. 


最 后 ， 连 接 到 数据 库 ERPDB 并 为 它 设 置 如 下 参数 ， 命 令 如 下 所 不 : 


upälarte do ctg using auto reyal DEFERRED FORCE; 
sse 


上 和 面 这 两 个 参数 的 具体 食 义 是 什么 ” 接 下 来 我 们 就 对 这 两 个 参数 寻 个 究 苋 。 

(1) 参数 AUTO REVAL: 当 遇 到 无 效 对 象 时 ，AUTO_REVAL 不 同 的 设置 决定 了 数据 库 
对 此 无 效 对 象 不 同 的 行为 。AUTO_REVAL 的 默认 值 是 DEFERRED， 意 思 是 如 果 一 个 对 象 例 如 
视图 或 函数 是 无 效 的 ， 下 一 次 如 果 被 引用 将 会 日 动 尝 试 使 之 生效 。 在 上 和 面 的 设置 中 ， 我 们 将 其 
从 默认 值 调 整 为 DEFERRED FORCE， 这 有 什么 好 处 呢 ? 我 们 用 一 个 例子 来 说 明 。 例 如 ， 有 一 
个 存储 过 程 依赖 一 个 尚未 创建 完成 的 表 ， 如 果 该 参数 设置 为 DEFERRED FORCE， 那 么 该 存储 
过 程 也 能 成 功 完成 创建 ， 但 是 ， 它 将 被 标注 为 无 效 的 。 等 到 依赖 表 成 功 创建 并 且 该 存储 过 程 第 
一 次 被 调用 时 ，DB2 将 自动 使 该 存储 过 程 生效 。 这 样 带 来 的 好 处 是 非常 明显 的 : 有 大 量 的 对 象 
需要 创建 ,但 是 确定 它们 之 间 的 依赖 顺序 非常 难 , 将 该 参数 设置 为 DEFERRED FORCE 将 解决 
这 一 难题 。 

(2) 参数 DECFLT ROUNDING: 如 果 应 用 程序 中 用 到 了 浮 点 类 型 DECFLOAT, 那 么 必然 
SARAI (rounding mode) 的 问题 。DECFLT ROUNDING 的 默认 设置 是 round-halfeven， 
它 和 Oracle 的 默认 舍 入 模式 不 同 。 读 者 可 以 将 该 设置 调整 为 round-half-up， 这 样 束 和 Oracle 5c 
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3. 创建 缓冲 池 和 表 空 间 
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数据 库 创 建 完 成 后 ， 就 可 以 根据 表 2-4 的 规划 创建 缓冲 池 和 表 空 间 了 。 
C15 创建 缓冲 池 


使 用 下 面 的 语句 ， 分 别 创建 了 HR DBP, HR IBP, QRY DBP, QRY IBP, RPT DBP 和 
RPT IBP 绥 冲 池 ， 其 中 PAGESIZE 表示 页 面 大 小 ， 创 建 完 毕 后 ， 这 些 缓冲 池 大 小 是 由 STMM 
目 动 管 理 的 。 通 币 使 用 STMM 目 动 调整 就 可 以 了 ， 但 是 这 个 腔 例 中 由 于 X3850 服务 器 的 内 存 
非常 多 ， 为 了 避免 STMM 市 来 的 内 存 分 配 和 回收 的 开销 ， 所 以 在 后 文 的 2.5.1 市 还 会 将 缓冲 池 


大 小 手工 调整 为 国定 大 小 。 


CREATE BUFPFERPOOL “HR DBP" PAGESIZE 8192 
CREATE BUFPERPOOL “HR IBP" PAGESIZE 8192 
CREATE BUFPERPOOL “ORY DBP“ PAGESIZE 16384 
CREATE BUFPFERPOOL “ORY IBP“ PAGESIZE 16384 
CREATE BUFPFERPOOL “RPT DBP! PAGESIZE 327606 
CREATE BUFFERPOOL “RPT IBP“ PAGESIZE 32708 


(2) 创建 表 空 间 


使 用 下 面 的 语句 ， 分 别 创建 了 HR DTS, HR ITS, QRY DTS, QRY ITS、RPT DTS 和 
RPT_ITS。 由 于 在 create database 语句 中 局 用 了 Automatic Storage, Pr EIER ^x [RIT] er RJ CAR. 


ET, AN 


CREATE 
CREATE 
CREATE 
CREATE 
CREATE 
CREATE 


F 


需要 显示 指定 容器 文件 ，DB2 可 以 自动 完成 创建 和 管理 。 


E 


TABLESPACE 
TABLESPACE 
TABLESPACE 
TABLESPACE 
TABLESPACE 
TABLESPACE 


ER DTS BUFPERPOOL HR DBP NO PILE SYSTEM CACHING 
ER ITS BUFPPERPOOL HR IBP NO PILE SYVSTEM CACHING 


ORY DTS 
QRY ITS 
RPT DTS 


BUEEERPOOL QRY DBP NO 
BUEEERPOOL QRY IBP NO 
BUEEERPOOL RPT DBP NO 


BL 
FILE 
P LLE 
PILLE 


SXSTEM CACHING 
oYSIEM CACHING 
[Ce TIERE CACHLNG 


RPT ITS BUPFPFPFERPOOL RPT IBP NỌ SOTEM CACHLNG 


2.26 DB2 参数 配置 


DB2 的 参数 包括 三 套 ， 即 环境 变量 、 数 据 库 管理 器 配置 参 
参数 (DBM CFG) 。 


f 


Zt (DBM CFG) 和 数据 库 配 置 


G 注意 : DB2 的 参数 设置 
这 里 给 出 的 只 是 初始 化 参数 配置 ， 在 后 面 2.$ 节 的 优化 实施 中 ， 将 会 根据 具体 情况 
骨 加 以 适当 调整 ， 


1. 设置 DB2 环境 变量 


环境 变量 的 设置 如 下 , 其 中 “DB2COMM=TCPIP” 是 为 了 支持 通过 TCP / IP 网 络 访 问 DB2 
数据 库 ; “DB2CODEPAGE=1208” 指定 了 UTF-8 编码 , 这 样 可 以 方便 db2move. import. export 
等 工具 进行 数据 导入 导出 时 使 用 正确 的 编码 。 


=> db2set DB2COMM-TCPIP 
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=> db2set DB2CODEPAGE=1208 


2. ix & DBM CFG 


参数 DIAGLEVEL 的 值 设 定 为 3， 表示 在 诊断 日 志文 件 中 记录 所 有 的 错误 和 和 警告。 关于 所 
有 设 定 值 的 含义 ， 如 下 所 示 : 

0 一 一 没有 捕获 到 诊断 数据 

1 一 一 仪 严 重 钳 误 

2 一 一 所 有 错误 

3 一 一 所 有 错误 和 和 警告 

4 一 一 所 有 错误 、 警 告 以 及 参考 消息 

参数 DIAGSIZE 的 值 如 果 为 0， 则 表示 不 启动 轮转 模式 ， 只 会 有 一 个 诊断 日 志文 件 
db2diag.log。 下 面 将 其 值 设 定 为 1024， 表 示 局 用 最 多 诊断 日 志文 件 个 数 为 10 的 轮转 模式 ， 这 
ede te YZ Br H ois HJ HJ. 1024M, 也 就 是 说 每 个 轮转 日 志文 件 最 大 为 100M (1024M /10 个 轮 
转 文 件 ) 。 轮 转 模式 将 使 用 10 个 轮换 诊断 日 志文 件 和 10 个 轮换 管理 通知 日 志文 件 ， 这 些 文件 
名 为 db2diag.n.log 和 <instance>.n.nfy， 其 中 ，n 是 整数 。db2diag.n.log 文件 和 <instance>.n.nfy 
文件 的 数目 都 不 能 超过 10。 当 第 10 个 文件 的 大 小 达到 限制 后 ， 将 删除 最 旧 的 文件 并 重新 创建 
新 文件 。 

参数 SHEAPTHRES 表示 整个 实例 范围 内 私有 排序 总 内 存 的 软 限制 ， 如 果 sheapthres 被 设 
置 为 0， 则 DB2 使 用 共享 排序 。 如 果 sheapthres 被 设置 为 非 0， 表 示 DB2 将 使 用 私有 排序 ， 排 
序 内 存在 代理 中 分 配 ，SORTHEAP 参数 此 时 则 规定 了 每 个 私有 排序 最 多 使 用 的 内 存量 。 这 个 案 
例 中 ， 设 定 SHEAPTHRES 的 值 为 0， 这 时 DB2 使 用 共享 排序 。 

E, DBM CFG 的 设置 如 下 : 


update dbm cfg using DIAGLEVEL 3 
db2 update dbm cfg using DIAGSIZE 1024 
update dbm cfg using SHEAPTHRES Q 


3. 设置 DB CFG 


DB CFG 的 配置 比较 多 ， 下 面 我 们 分 儿 部 分 曾 述 一 下 。 
(1) 预 取 和 清 页 进程 数目 设 定 。 
参数 NUM IOSERVERS 用 于 指定 数据 页 预 取 的 IO 服务 器 数目 ，NUM _IOCLEANERS 用 
于 指定 异步 页 清除 代理 程序 的 数目 。 为 了 方便 ， 这 两 个 参数 都 设 定 为 AUTOMATIC, XEEN e 
以 让 DB2 来 自动 管理 了 。 


Update ello ero us eM OmeNaRS OM 
Updare Clo ctg using NUM TOSERYERS AUTOMATIC 


(20 锁 参 数 设 定 

LOCKLIST 设 定 为 40960 个 4K 页 面 ， 指 定 了 分 配给 锁 列 表 的 存储 容量 。MAXLOCKS 1H 
定 了 允许 应 用 程序 占用 的 锁 列表 的 百分比 ， 设 定 为 40， 意味 看 当 一 个 应 用 程序 所 使 用 的 锁 列 表 
百分比 达到 40% 时 ， 数 据 库 管 理 器 会 升级 其 中 的 行 锁 ， 即 用 表 锁 代替 行 锁 ， 以 减少 锁 的 数量 。 
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LOCKTIMEOUT JRE Y HIE A IRA i IT] eR RP, Weng 30 秒 。 


update dio ctg using LOCKLIST 40960 
update db cfg using MAXLOCKS 40 
update do ctg using LOCKTIMEOUT 30 


(3) 日 志 参 数 设 定 

LOGBUFSZ 表示 日 志 绥 冲 区 大 小 ， 设 定 为 10240， 单 位 为 4K 页 面 ' LOGFILSIZ 表示 日 志 
文件 大 小 , 设 定 为 102400, 单 位 为 4K 页 面 ,这 样 每 个 日 志文 件 的 大 小 为 400 MB; LOGPRIMARY 
为 主 日 志文 件 个 数 ， 设 定 为 50，LOGSECOND 为 辅助 日 志文 件 个 数 ， 设 定 为 80， 这 样 最 多 事 
务 日 忘 文件 个 数 为 130 个 ， 每 个 日 志文 件 大 小 为 500M， 上 所 以 可 以 文 持 最 大 日 志 量 约 为 50G 
(130*400M) 左右 的 事务 。 

SOFTMAX 参数 决定 了 DB2 在 灾难 恢复 时 需要 读 取 日 志文 件 的 数目 , 同时 它 也 决定 了 数据 
缓冲 区 向 磁盘 写 入 数据 的 频率 ， 把 它 设 定 为 150。 当 把 SOFTMAX 值 设置 较 小 时 ， 则 当 发 生 灾 
难 恢 复 时 的 恢复 速度 会 变 快 , 但 是 数据 绥 冲 区 写 数据 的 频率 会 变 高 ， 即 LO 次 数 会 变 大 。 反 之 ， 
如 果 采 用 较 大 的 SOFTMAX 值 ， 则 数据 库 UO 频率 会 降低 ， 但 是 一 旦 发 生 灾 难 恢复 时 ，DB2 进 
行 恢 复 的 时 间 会 延长 。 一 般 情况 下 ，SOFTMAX 值 设 置 为 100~300 比较 合适 。 

NEWLOGPATH 设 定 为 “/db2log/trans”， 这 是 事务 日 六 的 存放 路 径 ，LOGARCHMETHI1 
设 定 为 “DISK:/db2log/arch”， 这 是 归档 日 六 的 存放 路 径 ， 这 也 是 按照 当初 的 规划 定义 的 。 

最 终 ， 日记 相关 参数 的 配置 如 下 : 

update db cfg using LOGBUFSZ 10240 

update db cfg using LOGFILSIZ 102400 

update db cfg using LOGPRIMARY 50 

update db cfg using LOGSECOND 80 

update dio cfg using SOETMAX 150 

update db cfg using TRACKMOD ON 


update db cfg using NEWLOGPATH /db2log/trans 
update db cfg using LOGARCHMETH1 DISK:/db2log/arch 


(4) 内 存 参 数 设 定 

内 存 参 数 的 设 定 是 最 复杂 的 , 这 是 由 于 这 些 参数 的 值 需要 根据 负载 来 动态 调整 , 如 果 徘 DBA 
来 手工 调整 是 不 现实 的 。 不过， 这 可 以 让 DB2 来 自动 调整 ， 例 如 下 面 的 多 个 内 存 相关 参数 都 设 
定 为 AUTOMATIC， 包 括 目录 高 速 缓存 大 小 CCATALOGCACHE SZ) 、 程 序 包 高 速 缓存 大 小 
(PCKCACHESZ) 、 语 名 堆 大 小 CSTMTHEAPO 、 应 用 程序 堆 大 小 (APPLHEAPSZ) 、 统 计 
信息 堆 大 小 CSTAT HEAP SZ) 、 共 享 排序 的 排序 堆 浆 值 CSHEAPTHRES SHRO 和 排序 堆 大 
小 CSORTHEAPO ， 还 有 其 他 的 一 些 内 存 参数 ， 此 处 不 再 列 出 。 

update ao ctg using CATALOGCACHE S2 AUTOMATIC 

update db ctg using PCKCACHESZ AUTOMATIC 

update db cfg using STMTHEAP AUTOMATIC 

update db cfg using APPLHEAPSZ AUTOMATIC 

update ao ctg using STAT HEAP SZ AUTOMATIC 


upälarte co ctg using SHEAPTHRES SHR AUTOMATIC 
update db cfg using SORTHEAP AUTOMATIC 
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2.3 实施 : DB2 HADR 


在 2.1.3 小 方 规划 了 DB2 HADR 高 可 用 方案 , 包括 DB2 主 节 点 和 从 节点 , 服务 器 都 为 性 价 
比 极 高 的 x3850 服务 器 ，64 个 内 核 、256GB 内 存 。 为 了 真正 满足 灾 备 的 需要 ，DB2 EAMA 
节点 是 里 机 房 部 普 的 ， 其 中 主 节 点 部 蜀 在 北京 大 兴 机 房 ， 从 市 点 部 署 在 北京 亦庄 机 房 ， 两 个 市 
点 之 间 通 过 专用 私有 网 络 连接 ， 选 择 近 同步 工作 模式 。 

当前 ， 主 节点 的 数据 库 尺 寸 已 经 达到 了 8TB 左右 ， 这 个 尺寸 已 经 很 大 了 ,但 是 客户 允许 主 
节点 的 最 多 停机 时 间 莞 然 只 有 24 个 小 时 ! 

这 一 他 ， 重 点 讲述 一 下 实施 过 程 。 


2.3.1 准备 工作 


ft DB2 HADR 的 实施 之 有 前， 需要 预先 准备 好 环境 。 

首先 ， 主 节点 服务 器 和 从 节点 服务 器 的 操作 系统 版 本 必须 完全 相同 。 这 个 案例 中 ， 主 节点 
和 从 节点 操作 系统 的 版 本 是 完全 一 致 性 的 ， 都 是 Redhat 企业 版 5.7。 

其 次 ,在 从 节点 服务 器 上 安装 和 主 节 点 完全 一 致 的 DB2 版 本 。 参 考 2.2.1~2.2.4 小 节 ， 在 从 
节点 上 也 执行 和 主 节 点 一 致 的 过 程 ， 包 括 DB2 安装 、 操 作 系 统 参 数 配 置 、 实 例 创 建 以 及 存储 规 
划 与 文件 系统 创建 。 


A 注意 : 从 节点 上 的 DB2 参数 不 需要 : 
不 需要 在 从 节点 上 创建 数据 库 和 进行 参数 配置 工作 ， 在 后 面 的 2.3.2 小 节 ， 读 者 就 
可 以 理解 ， 从 节点 上 的 DB2 数据 库 文件 从 主 节 点 直接 复制 过 来 ， 随 后 再 编目 (catalog ) 
ATAT. 


第 三 ， 对 HADR 主 节 点 -从 节 扣 连接 使 用 专用 网 络 。 应 用 通过 和 干 兆 以 太 网 络 连 接 主 入 点数 
据 库 以 及 从 节点 数据 库 ， 为 了 不 占用 应 用 网 络 的 市 宽 ， 在 主 贡 点 和 从 布点 内 部 通信 上 使 用 单独 
的 网 络 ， 代 码 如 下 所 示 ， 其 中 “192.168.3.1” 为 主 和 点 配置 的 IP 地 址 ， 对 应 的 域名 为 
“PrimaryNode-2”，“192.168.3.2” 为 从 市 点 配置 的 IP 地 址 ,对 应 的 域名 为 “StandbyNode-2”。 


[root@PrimaryNode-2 ~]# cat /etc/hosts 


POOR localhost. localcdomain localhost 
TOR Sl PrimaryNode-1 
TOS NS NT. StandbyNode-1 
192.168.3.1 PrimaryNode-2 
192.168.3.2 StandbyNode-2 
2.8.2 复制 数据 库 
本 小 节 讲 到 的 复制 数据 库 ， 意 思 是 把 主 节 点 上 的 erpdb 数据 文件 复制 到 从 节点 所 在 的 服务 


器 上 ， 需 要 复制 的 数据 库 文件 路 径 如 下 ， 其 中 /db2f1、/db2f2 和 /db2fs3 为 数据 文件 所 在 路 径 ， 
/db2log/trans 为 事务 日 六 所 在 路 径 。 
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loona 
/ dio2 Es2 
/ dio2 10 6:5) 
/ dio2 lLog/ trans 


VN 注意 : 为 什么 不 采用 主 节 点 备份 和 从 节点 性 复 
配置 HADR， 通 常 的 做 法 是 在 主 节点 对 数据 库 做 备份 ， 随 后 把 备份 介质 从 主 节点 复 
制 到 从 节点 ， 随 后 在 从 节点 恢复 。 这 种 做 法 适合 数据 库 尺 寸 较 小 的 场景 ， 否 则 备份 、 介 
质 传输 和 恢复 需要 的 时 间 过 长 ， 会 影响 业务 使 用 。 
在 本 案例 中 ， 数 据 库 尺寸 已 经 达到 了 8TB 左右 ， 而 且 主 节点 的 最 大 允许 停机 时 间 只 
24 个 小 时 ， 所 以 我 们 采用 了 将 主 节 点 的 数据 库 文件 复制 到 从 节点 ， 随 后 在 从 节点 catalog 
的 方式 ， 这 样 就 币 省 了 备份 和 恢复 的 时 间 ， 


接 下 来 ， 我 们 详细 讲解 一 下 实施 步骤 。 
(1) 对 主 节 点 数据 库 停 机 
EERE, SAT Pm: 


lerpinstlilPrimaryNode=2 ~]$ 2 corce applications all 
[eriDinst kemane 2 deacttivate dd BREDE 


(2) BEE TAAI EER IO 
在 主 太 点 上 ， 执 行 下 面 的 命令 : 


[erpinstl8PrimaryNode-2 -«]$ db2 set write suspend for database 
DB20000rI The SET WRITE command completed successfully. 


(3) BEET A II A EA H S OC 
在 这 个 案例 中 ， 我 们 选择 了 rsysn 工具 实现 数据 文件 的 复制 工作 ， 有 具体 步骤 如 下 : 


Aa 注意 : 为 什么 选择 rsync 工具 ? 
rsync ( Remote Synchronize ) 是 Unix/Linux 系统 下 的 数据 镜像 备份 工具 ， 它 基于 客 
户 端 -服务 器 端 工作 模式 ,支持 断 点 续 传 ， 是 一 款 快 速 实现 远程 同步 功能 的 软件 ， 在 同步 
目录 和 文件 的 同时 ， 可 以 保持 原来 文件 的 权限 、 时 间 、 软 硬 链接 等 附加 信息 。 
本 案例 中 ， 在 从 主 节点 向 从 节点 复制 数据 文件 时 ， 需 要 确保 文件 和 路 径 完全 一 致 ， 
而 且 中 间 传 输 中 出 现 问 题 时 ， 还 希望 实现 断 点 续 传 ， 这 些 要 求 正 是 rsync 工具 最 擅长 做 
的 ， 所 以 最 终 选 择 了 rsync 工具 。 


CD 编辑 配置 文件 
在 这 个 案例 中 , ETA PrimaryNode-2 为 rsync HARS s&9m, 从 市 点 StandbyNode-2 为 rysnc 
的 客户 问 ， 在 主 节 点 上 编辑 /etc/rsyncd.conf 文件 ， 配 置 需要 复制 的 日 录 ， 如 下 所 示 : 


[ootE@BPEimaryNode-2~]# cart /ete/rsyned. conf 


[db2fs1] 

path -» /db2fs1/ 

auth users = erpinstl 
uid = root 
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gid = root 


secrets file = /etc/rsyncd., secrets 
read only = no 

[db2fs2] 

path - /db2fs2/ 

auth users = erpinstl 

uid = root 


gid = Foot 


secrets file = /etce/rsyncd., secrets 
read only = no 

[db2fs3] 

path copi 

auth users = erpinstl 

uid = root 


gid = root 


secrets file = /etce/rsyncd., secrets 
read only = no 

[elo2 Log] 

path = /db2log/trans 

auth users = erpinstl 

uid = FOOT 


gid = root 
secrets file = /etc/rsyncd. secrets 


read only = no 


TE/etc/rsyncd.conf 文件 中 ， 应 用 了 密码 文件 /etc/rsyncd.secrets， 这 个 文件 中 的 用 户 名 和 密码 
是 rsync 客户 问 复 制服 务 占 问 数 据 时 需要 提供 的 。 这 个 文件 的 内 容 如 下 所 示 ， 用 户 名 为 


“erpinstl” , AA “password” - 


[rootûPrimaryNode=2 ~]# car /erte/rsyned. secrets 


erpinstl:password 


(2) 局 动 rsync 服务 
首先 ， 编 辑 /etc/xinetd.d/rsync 文件 ， 将 “disable = yes” 改 为 “disable =no”， 这 表示 在 主 
世上 点 上 局 用 rsync 服务 。 


[root@lPrimaryNode=2 ~+]; cat /etc/xinetd.@/rsyne 

iW default: off 

$ deseriptions The rsyne seryer is a good addicion to an fto server, as it \ 
# allows crc checksumming etc. 

service rsync 

{ 

# 需 要 从 yes 修改 为 no 


disable = no 

SOS Type = stream 

wait = no 

user —- root 

server = /usr/bin/rsync 
server arge = --daemon 


40 


第 2 章 Zautemmxb5i um 


log on failure += USERID 
) 


随后 ， 如 下 所 示 ， 在 主 节 点 上 局 动 xinetd 服务 : 


[root8üPrimaryNode-2 ~]; service xinetd restart 
Stopping xinete: | OK ] 
Starting xinete: | OK ] 


(3) 开始 同步 

为 了 提高 效率 ， 可 以 同时 使 用 主 和 节点 上 的 两 块 网 卡 ， 即 外 网 IP 地 址 10.2.3.1 和 内 网 IP 地 
HE 192.168.3.1， 同 时 对 数据 文件 路 任 和 日 志文 件 路 任 进 行 同步 。 

复制 db2fsl 目录 ， 使 用 PrimaryNode-1 域名 ， 即 IP 地 址 为 10.2.3.1， 命 令 如 下 : 


Solo nll oe eels 

DATE= date -$Y$m$d$H$M' 

mob rsync =aĝyi ==password=file /ete/reyncd. secrets erpinstiE PrimaryNode m1: :db2fs1 
/db2fsi1 >/var/log/rsyne.datal, $DATE & 

[rootüStandbyNode-2 ~]# ./rsyncl.sh 


复制 db2fs2 目录 ， 使 用 PrimaryNode-1 域名 ， 即 IP 地 址 为 10.2.3.1， 命 令 如 下 : 


[rootlStancdioyNode=2 ~]; Cat rsynez, sh 

DATE=` date +%Y%m%d%H%M` 

nonup rsync sayi ==password=file /ete/rsyncd., secrets erpinstilE camus dedecus» 
/db2fs2 >/var/log/rsync.data2.ŞDATE & 

[root@StandbyNode-2 ~]# ./rsync2.sh 


复制 db2fs3 Hox. fH] PrimaryNode-2 域名 ， 即 IP 地 址 为 192.168.3.1, MSU F: 


[rootlStancdioyNode=2 ~]; Cat rsynes, sh 

DATE=` date +%Y%m%d%H%M` 

nonNup rsync =agyi ==password-=rfile /ete/reyncd. secrets erpinst1t PrimaryNode=2; :co2fs3 
/db2fs3 >/var/log/rsync.data3.ŞDATE & 

[rootüStandbyNode-2 ~]# ./rsync3.sh 


复制 db2log 目录 ， 使 用 PrimaryNode-2 域名 ， 即 IP 地 址 为 192.168.3.1, MSU F: 


[root@StandbyNode-2 ~]# cat rsynclog.sh 

DATE= date -$Y$m$d$H£$M' 

nohup rsync =a$yn ==password=rile /ete/rsynced., secrets SN Ne lS 6521066 
/dlb2l0g/ trans >/var/log/rsyne. trans. $DATE & 

mocmaisrandiiM edee sen ee 


O 监控 复制 过 程 

由 于 需要 复制 的 文件 比较 大 ， 有 8TB 左右 ， 通 过 干 兆 以 太 网 复制 的 话 ， 全 少 需 要 10 小 时 
ZH. Bip mrs. 

例如 ， 使 用 “ps -ef” 命 令 监控 rsync 进程 ， 可 以 看 到 4 个 进程 ， 其 中 3 个 是 复制 数据 目录 
的 ，1 个 是 复制 事务 日 六 目录 的 。 


[root@StandbyNode-2 ~]# ps -ef | grep rsync 
TOOT 7011 6592 0 21:334 BES/1 00:00:00 grep rsyne 
TOOT 24170 24169 50 16:24 ?F 01:35355 rsyne -ayi =--passworc-file 
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"eue anesvmecdesesnmetsenouWmsibil bi mar lol ss 


TOOT 2Z4AS40 24339 51 16:25 ? 01:357359 rsyne =-aSyH =--password-file 
/ete/reynecd. secrets erpinstiklPrimaryNode=1; scobo2fs2 I Pus 

TOOT 24370 243609 83 16:26 ? 02357342 rsync -aSyH =--password-file 
/ete/reynced. secrets erpinstilPrimaryNocde=2; :db2f83 /ao26S3 

TOOT 24370 24399 83 18:26 ? 02357342 resyne -aSyH =--password-file 


/ete/reyncd. secrets erpinstilPrimaryNode=2s; :db2log xit» oc de 


例如 ， 使 用 nmon 命令 监控 网 络 情况 ， 其 中 eth0 为 连接 外 网 的 网 卡 ，IP 地 址 为 10.2.3.1， 
eth4 为 连接 内 网 的 网 卡 ，IP 地 址 为 192.168.3.1。 从 下 面 的 输出 可 以 看 到 ， 两 个 网 卡 都 同时 在 工 


[rootüPrimaryNode-2 ~]# nmon 
Tenon o rre E EU EE Hostname-db2serv2————— Refresh- 
Aaeeea uc M D Iu DI LE ULL IPIE 


I/F Name Recv-KB/s Trans-KB/s packin packout insize outsize Peak-»Recv Trans | 


| 

| lo 26.2 PIG 536.0 536.0 50.0 50.0 E27 52.2 | 
|  eth4 38430.6 176.2 26297.0 2573.8 1496.5 70.1 84480.6 458.0 | 
| eth5 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 | 
| eth6 Qe 0.0 0.0 0.0 0.0 0.0 0.0 0.0 | 
| usb0 0.1 0.0 1.0 0.5 65.0 42.0 Qe Qe) | 
| ein 0.0 0.0 0.0 0.0 0.0 OD 0.0 0.0 | 
| usb1 0.0 0.0 0.0 0.0 0.0 0.0 Qe 00 | 
| eth0 103935.2 723.4 70585.8  11221.8 1507.8 66.0 182302.1 1382.9 | 
| ethl 0.0 0.0 0.0 0.0 0.0 (EID 0.0 0.0 | 
| eth2 0.0 0.0 0.0 0.0 0.0 OE 0.0 0.0 | 
| eth3 0.0 0.0 0.0 0.0 0.0 OI) 0.0 030) | 


(6) 完成 后 检查 
执行 完 rsync 同步 后 ， 使 用 find 命令 检查 主 节点 和 从 节点 的 /db2fs1、/db2fs2、/db2fs3 和 
/db2log/trans 下 的 文件 个 数 及 大 小 是 否 一 致 。 


find /dio2fs1 =type E =ls | we =1 
find /dio2fe2 =type £E -lg | WE =1 
find /dibo2fe2 =type E =ls | we -=1 
rind /db2log/trans =type dE =lẹ | we =1 


确认 完全 一 致 后 ， 就 说 明 rsync 已 经 成 功 把 数据 和 日 志 从 主 节 点 复制 到 从 节点 上 了 。 
(4) 恢复 主 节 点 数据 库 上 的 IO 
使 用 下 面 的 命令 进行 恢复 ， 这 样 主 数据 库 就 可 以 继续 接受 访问 了 。 


[erpinstl8PrimaryNode-2 -]$9 db2 set write resume for database 
DB200001 The SET WRITE command completed successfully. 


C5) ORE e US EE XETI 2a H 
如 下 所 示 ， 这 可 以 使 用 catalog database 命令 来 完成 : 
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[erpinstil8StandbyNode-2 -«]$9 db2 catalog database erpdb on /db2fs1 
DB20000I The CATALOG DATABASE command completed successfully. 


DB21056W Directory changes may not be effective until the directory cache is 
refreshed. 


C60 ORE MAC e OS AE XETT WIR M. 
如 下 所 示 ， 首 先 使 用 db2start 命令 在 从 节点 上 启动 数 据 库 ， 随 后 使 用 “db2initdb erpdb as 
standby” 来 初始 化 从 和 点 数据 库 。 


[erpinst1@StandbyNode-2 ~]$ db2start 


11/30/2012 22354323 0 0 SQL1063N DB2START processing was successful. 
SOLIOGSN DB2START processing was successful, 


[erpinst1@StandbyNode-2 -]$ db2inidb erpdb as standby 
DBT1000I The tool completed successfully. 


2.3.3 Bi HADR 


在 正式 局 动 HADR -E T EUNUACTS ESZL BU, 般 要 进行 必要 的 配置 工作 ,其 体 包 括 下 面 一 些 配 
置 步 又 。 
(1) 配置 HADR 的 通讯 端口 
在 主 廊 点 和 从 市 点 的 /etc/services 文件 末尾 ， 加 入 一 行 “db2h db2inst170000/tcp”， 用 以 指 
定 主 节点 和 从 市 点 之 间 的 通讯 问 口 。 


db2c erpinstl1 50001/tcp tt DB2 connection service port 
DE ee atten s COOCOO rero 

DE 200 1r JE (500000 1L / tero 

DE oe EE (01002 te oro. 

BE db2instl END COCO ECR 

db2h_erpinst1 70000/tcp #db2 hadr service port 


(2) 数据 库 参 数 配置 
节点 的 DB CFG fit: 


ee ron e em eo | ee oor eee Mam mad Ne 
DB20000I The UPDATE DATABASE CONFIGURATION command completed successfully. 

lecot mac en my eel —2. s] eo ae elo eXer fou eel usce. eee. cue cls2I0. Grube 
DB20000I The UPDATE DATABASE CONFIGURATION command completed successfully. 

eee me E TE (RC e tme re valores — | oe va od or ee ya mE an esuelosNoeleo > 
DB20000I The UPDATE DATABASE CONFIGURATION command completed successfully. 

| exse sr te b Ee tomi se ol —2. c ]| ode vat er or beoe ma eae eC OLOZg STU e IL 
DB200001I The UPDATE DATABASE CONFIGURATION command completed successfully. 

ee el Ee tumpesewilbkorele > | 092 0 Oleo (CXEG| a Sese leues erem me der emque 
DB20000I The UPDATE DATABASE CONFIGURATION command completed successfully. 
lerpinsti@lPrimaryNode=2 ~] 6052 update do cfg for erpai using logincdexbouilo on 
DB20000I The UPDATE DATABASE CONFIGURATION command completed successfully. 
lerpinstilPerimaryNode=2 ~] $ 全 52 update do efg for erpilo using incdexrec restart 
DB20000I The UPDATE DATABASE CONFIGURATION command completed successfully. 


从 节点 的 DB CFG 配置 : 
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区 Base candor Nede 2. | de tiere leuis ctoreor em TSH lmewele  JuoxeLl nbus Gan No > 
DB20000I The UPDATE DATABASE CONFIGURATION command completed successfully. 

| exspecto eu TES Eee Neas 5] H9 0 update ello ero ior ro Sin e ar Los ewe qe E 
DB20000I1 The UPDATE DATABASE CONFIGURATION command completed successfully. 

| exeresba el ts da ceLosikkorele —2 «| & elo voor (CHE C] db iode en ei adr erm e mes eae 2 
DB20000I1I The UPDATE DATABASE CONFIGURATION command completed successfully. 

| extre ia ede dL cande Nede c] de update ello (GHe or Tte (Cxerexello TUS LING] a or ee ve no lms 
DB20000I The UPDATE DATABASE CONFIGURATION command completed successfully. 

[exea SEIL masds c] x92. Uo (Clo (edo Jede exis Weser ned oem wet. er qe 
DB20000I The UPDATE DATABASE CONFIGURATION command completed successfully. 
lerpinsti@lstancdoyNode=2 =] el update do cfg for erpai using logindexbuile onm 
DB20000I The UPDATE DATABASE CONFIGURATION command completed successfully. 
lerpinsti@lStancioyNode=2 el update dob ctg for erpilo using indexre restart 


DB20000I The UPDATE DATABASE CONFIGURATION command completed successfully. 


(3) 注册 变量 配置 

DB2 从 V9.7 开始 增加 了 从 节点 读 特 性 ， 即 Read On Standby (RoS) ， 男 外 ， 从 节点 读 只 
x ff UR CUncommit Read) 隔离 级 别 。 所 以 ， 可 以 通过 db2set 命令 ， 在 主 节 点 和 从 节点 同时 设 
$ *DB2 HADR ROS=ON” 和 “DB2 STANDBY ISO=UR”， 如 下 所 示 : 


ETARE: 


[erpi net e imar a e m T op eo MEETS ON 
[erpinst iki rimaryNode 2 | cl UPS TOTANDBY ISOUR 
[erpinst1@0PrimaryNode-2 ~] $ db2set 

DB2 COMPATIBILITY VECTOR=ORA 

DB2COMM=TCPIP 

DB2CODEPAGE=1208 

DB2 HADR ROS-ON 

DB2 STANDBY ISO-UR 


NOB dH: 


[erpin t dobencoviodecoms qo SE De HADR TRO ON 
[erpi nst G0 Standby Node 2 | dp2set DB2 STANDBY ISOUR 
[erpinst1@StandbyNode-2 ~] $ db2set 

DB2 COMPATIBILITY VECTOR=ORA 

DB2COMM=TCPIP 

DB2CODEPAGE=1208 

DB2 HADR ROS-ON 

DB2 STANDBY ISO-UR 


2.3.4 ”启动 主 从 数据 库 


启动 时 ， 按 照 先 从 节点 后 主 节 点 的 顺序 启动 。 
C) 局 动 从 下 点 数据 库 
如 下 所 示 , 首先 使 用 db2start 命令 在 从 节点 上 局 动 数据 库 , 随后 使 用 START HADR ON DB 
ERPDB AS STANDBY" ”命令 启动 从 节点 数据 库 。 
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ea el ele etum 
11/30/2012 223554323 0 0 SOL1063N DB2START processing was successful. 
SOLIOGSN DB2START processing was successful, 


[erpinst1@StandbyNode-2 ~]5$ db2 START HADR ON DB ERPDB AS STANDBY 
DB20000I The START HADR ON DATABASE command completed successfully. 


(2) 启动 主 节点 数据 库 
如 下 所 示 , 首先 使 用 db2start 命令 在 主 节 点 上 启动 数据 库 , 随后 使 用 “START HADR ON DB 
ERPDB AS PRIMARY ”来 初始 化 主 节点 数据 库 。 


ee sms ee Nelele el ue 
11/30/2012 22354323 0 0 SOL1063N DB2START processing was successful. 
SOL1063N DB2START processing was successful. 


[erpinst1@PrimaryNode-2 ~] $ db2 START HADR ON DB ERPDB AS PRIMARY 
DB20000I The START HADR ON DATABASE command completed successfully. 


2.3.5 HADR 切换 演练 


EETAREWME, MCI s nIELB sg THEE EA PART FELUM 
Zk, XXFEDAEUEU BUSES LAS Dn Y o 


1. 切换 前 状态 


使 用 db2pd 监控 主 节 点 数据 库 (PriamryNode-2 这 时 是 主 节 点 ) : 


[erpinstl@PriamryNode-2 ”| $ db2pd -d erpdb -hadr 


Database Particion 0 == Database EREDB == Active == Up 0 days 00:16:11 == Date 12/01/2012 
0030920 


PADRE Eo diee 


Role State SyncMode HeartBeatsMissed LogGapRunAvg (bytes) 
Primary Peer Async 0 0 

ConnectStatus ConnectTime Timeout 

Connected Sa Dee 1 00:08:05 2012 (1354291685) 120 

LocalHost LocalService 

PrimaryNode-2 db2h erpinstl 

RemoteHost RemoteService Remotelnstance 
StandbyNode-2 db2h erpinstl erpinstli 


PrimaryFile PrimaryPg PrimaryLeN 
S0000002.LOG 6 Ox00001EF2FE832EE)5 


StandByFile StandByPg StandByLSN 
S0000002 .L106 0 0x00001F2FE8328010 


使 用 db2pd 监控 从 市 点 数据 库 (StandbyNode-2 3x If Z& P T zi) 
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[erpinst1@StandbyNode-2 ~] $ db2pd -d erpdb -hadr 


Database Partition 0 == Database EBERPDB == ACtivye Standioy == Up 0 days 00303:2888 == Date 
12/01/2012 00:07:57 


PADRE Onm en 


Role State SyncMode HeartBeatsMissed LogGapRunAvg (bytes) 
Standby Peer Async 0 0 

ConnectStatus ConnectTime Timeout 

Connected S Dec 1 00:07:13 2012 (1354291633) 120 

ReplayOnlyWindowStatus ReplayOnlyWindowStartTime MaintenanceTxCount 
Inactive N/A 0 

LocalHost LocalService 

StandbyNode-2 db2h erpinstl 

RemoteHost RemoteService Emelec nae 
PrimaryNode-2 db2h erpinstl erpinstli 


PprimaryFile Primary?g PrimaryLeN 


S0000002.LOG 0 Ox00001EF2FE8328010 

StandByFile StandByPg StandByLSN StandByRcvBufUsed 

50000002 LOG Q0 0x0000IF2FE8328010 0% 

2. 切换 

在 从 节点 上 执行 “takeover hadr" MS, SIFAT RAKARE ET Ro AE H deu 
后 手工 切换 模式 。 


[epum scbastaudibvNede-2 =]$ diob2 takeover hadr on database erpdio 
DB20000I The TAKEOVER HADR ON DATABASE command completed successfully. 


3. 切换 后 状态 


使 用 db2pd 命令 监控 主 节 点 数据 库 (StandbyNode-2 这 时 变 为 主 节 点 ) 


[erpinst1@StandbyNode-2 ~]$ db2pd -d erpdb -hadr 


Database Particion 0 == Database ERPDB == Active == Up 0 days 09:38342 == Date 12/01/2012 
09543311 


DE en: 


Role State SyncMode HeartBeatsMissed LogGapRunAvg (bytes) 
Primary Peer Async 0 0 

emmee es ee en Timeout 

Connected Sa Dee 1 00:07:13 2012 (1354291633) 120 

LocalHost hocabsServrce 

StandbyNode-2 db2h erpinstl 
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RemoteHost RemoteService Remotelnstance 


PrimaryNode-2 db2h erpinstl erpinstl 


PrimaryFile PrimaryP’g demere NS 
0000002 .DoG 4920 0x00001F2FE966031A 


StandByFile StandByPg StandByLSN 
S0000002.LOG 4920 0x00001F2FE966031A 


使 用 db2pd 监控 从 节点 数据 库 (PriamryNode-2 这 时 变 为 从 节点 ) : 


eas tN meu oll 是 52108 = 三品 二 站 5 a 


Database Particion 0 == Databases ERPDB == Standy == Up 0 days 09:51:10 == Date 12/01/2012 
09:44:19 


PADRE na 


Role State SyncMode HeartBeatsMissed LogGapRunAvg (bytes) 
Standby Peer Async 0 15041024 

ConnectStatus Connect Time Timeout 

Connected Sape Dee 1 00:08:05 2012 (1354291685) 120 

loca Host LocalService 

PrimaryNode-2 db2h erpinstl 

RemoteHost RemoteService Remotelnstance 
StandbyNode-2 db2h erpinstl erpinstli 


PprimaryFile PrimaryPg PrimaryLeN 


50000002 LOG 4920 0x00001F2FE966031A 
StandByFile StandByPg StandByLSN StandByRcvBufUsed 
S0000002.LOG 0 0x0000IF2FE8326010 0% 


2.3.6 ”为 Java 应 用 配置 ACR 


当主 节点 和 从 节点 之 间 发 生 故 障 切 换 时 ， 客 户 端 应 用 程序 的 数据 库 连 接 可 以 通过 自动 客 刻 
Xm EHI CACR) 机 制 转移 到 新 的 主 市 点 ， 这 需要 在 客户 问 配 置 ACR 来 实现 。 

DB2 分 析 库 的 应 用 使 用 Java 语 言 开 发 的 ,下 面 将 讲述 在 Java 应 用 中 ,如 何 通过 对 DataSource 
和 JNDI 的 设置 来 配置 ACR。 


1. DataSoure 设置 


下 面 的 代码 是 DataSoure 的 例子 ， 其 中 ds 为 DataSource 属性 对 象 。 调 用 “setServerName” 
方法 指定 主 太 点 域名 为 “PrimaryNode-1”， 调 用 “setPortNumber ”方法 指定 主 和 点 的 端口 为 
50001; 调用 “setClientRerouteAlternateServerName” 方 法 指定 从 节点 域名 为 “StandbyNode-1”， 
调用 “ setClientRerouteAlternatePortNumber " 7; 1X 18 E MA Wi sim OA 50001. P, 


“PrimaryNode-1” 和 “StandbyNode-1” 都 是 在 /etc/hosts 文件 中 指定 的 〈 见 2.3.1 W) 。 
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ds.setDriverType (4); 

ds.setServerName ("PrimaryNode-1"); 

ds.setPortNumber ("50001"); 
ds.setClientRerouteAlternateServerName ("StandbyNode-1"); 
ds.setClientRerouteAlternatePortNumber ("50001"); 


2. JNDI iz & 


下 面 的 代码 是 配置 JNDI 的 例子 ， 创 建 一 个 DB2ClientRerouteServerList 的 对 象 address. K8 
后 调用 setPrimaryServerName 和 setPrimaryPortNumber 分 别 指定 主 节点 域名 “PrimaryNode-1” 
和 端口 号 50001; 再 调用 setAlternateServerName 和 setAlternatePortNumber 分 别 指定 从 节点 域名 


* StandbyNode-1" AH» O- 50001. 


ds.setDriverType(4); 

// Create a starting context for naming operations 
LInrbpadlcontexR registry = new Inwtralcontext(7 

// Creare a DB2CITentReroutes5erverbrst object 
DB2ClientRerouteServerList address = new DB2ClientRerouteServerList(); 
// Set the server name and port number for the primary server 
address.setPrimaryServerName("PrimaryNode-1"); 
address.setPrimaryPortNumber (50001); 

// Ser che port number and seryer name for the alternate server 
int[] port = {50001}; 

String[] server = {"StandbyNode-1"}; 
address.setAlternateServerName(server); 


address.setAlternatePortNumber (port); 


registry.rebind("serverList", address); 
// Assign the JNDI name of the DB2ClrentherouteServerbist object to the 
// clientRerouteServerListJNDIName property 


datasource.setClientRerouteServerListJNDIName("serverList"); 


2.4 ”性 能 分 析 


按照 上 面 的 步骤 完成 了 DB2 经 营 分 析 库 的 搭建 ， 完 成 了 HADR 方案 的 实施 并 成 功 上 线 ， 
从 效果 来 看 ， 取 得 了 非常 好 的 回报 : 分 析 查 询 、 报 表 和 人 力 资源 管理 等 从 原来 的 Oracle RAC 
数据 库 中 剥离 出 来 ， 在 DB2 中 运行 ， 查 询 时 间 满 足 了 设计 需求 ; 改造 后 Oracle RAC 数据 库 只 
运行 供应 链 、 和 生产、 财务、 营销 等 业务 模块 ， 所 能 处 理 的 事务 吞吐 量 达 到 了 要 求 ， 相 应 的 服务 
器 负载 也 下 降 了 50% 左 右 。 这 些 获 得 了 该 汽车 制造 商 极 高 的 评价 和 认可 。 

由 于 前 期 的 软 便 件 规划 比较 好 , 实施 也 比较 专业 ,所 以 这 个 DB2 经 营 分 析 库 上 线 初 期 运行 
得 非常 好 ， 碍 询 的 啊 应 时 间 、 事 务 知 吐 量 都 能 满足 需要 ， 但 是 运行 了 几 个 月 后 ， 开 始 出 现 了 一 
些 性 能 问题 ， 这 些 问题 中 有 的 只 是 影响 了 应 用 ， 例 如 茶 些 查询 ， 有 的 影响 了 整个 数据 库 ， 例 如 
大 量 的 锁 等 待 、 频 繁 的 大 表 扫 朱 、 大 量 的 排序 溢出 等 。 

从 第 1 章 了 解 到 ， 人 性 能 优化 的 背后 实际 上 是 业务 需求 驱动 的 。 首 先 需 要 从 业务 角度 将 问题 
分 类 并 识别 结果 ， 即 从 业务 角度 确定 问题 ， 设 定 每 个 问题 的 优化 目标 ， 并 设 定 每 个 问题 的 优先 
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级 。 随 后 从 系统 角度 确定 原因 ， 弄 清楚 时 间 人 花 在 何 处 ? 时 间 是 如 何 被 消耗 的 ?如 何 减少 时 间 耗 
费 ? 同时 要 券 虑 到 不 同 问 题 之 间 的 连 融 效应， 避免 解决 一 个 问题 的 同时 和 市 来 新 的 问题 。 

接 下 来 ， 针 对 这 个 采 例 ， 我 们 残 从 业务 分 析 开 始 ， 随 后 谈 谈 系 统 分 析 ， 最 后 给 出 优化 打上 略 
和 实施 计划 。 


2.4.1 业务 分 析 


提升 数据 库 的 性 能 其 实 是 为 了 给 应 用 融 来 价值 ， 那 么 当 开 始 处 理性 能 问题 的 时 候 ， 必 须 先 
理解 业务 需求 。 

运行 儿 个 月 后 ， 出 现 的 性 能 问题 从 应 用 角度 看 ， 是 这 样 的 : 分 析 奏 询 中 一 些 根据 动态 条 件 
进行 租 询 的 语句 执行 速度 越 来 越 慢 ， 特 别 是 忙 时 更 严重 ;报表 生成 时 间 也 随 独 数据 量 的 增长 而 
越 来 越 长 ， 人力 资 源 管理 模块 中 ， 当 访问 量 很 大 ， 系 统 处 于 忙 时 事务 啊 应 时 间 显 和 闭 提 高 。 如 表 
2-5 HIZR o 


R 2-5 性 能 问题 〈 业 务 角 度 ) 

应 用 发 生 时 机 
bti 事务 啊 应 时 间 越 来 越 长 , 从 刚 上 线 的 | 要 求 啊 应 时 间 稳 定 在 1 分 钟 仅 在 系统 忙 时 
30s 元 右 增 加 到 2 分 钟 以 上 ， 己 经 影 | 以 内 RE 

uy Hi BERI 

执行 动态 碍 询 上 存在 性 能 问题 , 有 的 | 优化 动态 碍 询 语句 ， 在 2 分 | 忙 时 和 闲 时 都 
需要 5 分 钟 以 上 的 时 间 才 能 获得 访问 | 钟 以 内 出 结果 ^A AE, TENIS 
ZA. nu Bi m v HIXE ARE 2 分 钟 数 严重 

据 库 没有 人 返回 结果 就 认为 是 超时 了 

刚 上 线 时 报表 生成 时 间 为 8 个 小 时 左 | 寻找 一 种 不 完全 依赖 于 数据 | 困 时 和 和 忙 时 痢 
H, 目前 已 经 达到 了 20 个 小 时 左右 ，| 量 的 方 条 ， 将 报表 的 生成 时 | 发 生 

随 看 数据 量 的 不 断 增 长 , 这 个 时 间 还 | 间 控 制 在 维护 窗口 可 接受 的 

在 逐渐 增加 范围 ， 即 8 小 时 左右 


2.4.2 系统 分 析 


束 性 能 优化 实践 来 说 ， 完 成 业务 分 析 后 接 下 来 需要 弄 清楚 整个 系统 的 情况 ， 这 包括 存储 、 
主机 、 操 作 系 统 以 及 数据 库 服务 器 。 这 要 和 系统 管理 员 以 及 网 络 管理 员 进 行 沟通 ， 尽 量 全 面 地 
收集 信息 以 准确 定位 问题 。 

考虑 到 篇 幅 所 限 ， 本 革 将 以 数据 库 为 重点 进行 讲解 。 那 么 首先 就 需要 监控 ， 从 而 分 析 和 害 
位 问题 。 监 控 包 括 两 个 层面 ， 第 一 层面 是 对 数据 库 本 里 监控 ， 分 为 忙 时 和 内 时 ; 第 二 个 层面 是 
对 应 用 监控 ,包括 分 析 查 询 、 报 表 和 人 力 资源 管理 。 

那么 怎么 选择 监控 手段 呢 ? DB2 提供 了 多 种 多 样 的 监控 手段 ， 主 要 包括 快照 监视 器 
(Snapshot Monitor)、 事 件 监视 器 (Event Monitor)、 I as ER 2C C Monitoring Table Functions), 
管理 视图 CAdministrative Views? . db2pd 以 及 db2top 等 。 

需要 注意 的 是 ， 在 执行 上 和 面 的 监控 命令 前 ， 首 先 需 要 打开 监控 开关， 本 书 第 6 章 将 讲述 如 
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何 打开 。 打 开 开 关 后 ， 可 以 使 用 get monitor switches 命令 查询 各 个 快照 开关 的 状态 ， 如 下 所 示 ， 
所 有 上 蚊 柱 开关 已 分 打开 本: 


=> db2 get monitor switches 


Monitor Recording Switches 


Switch list for clo ee 


Buffer Pool Activity Information (BUFFERPOOL) = ON 

Lock Information (LOCK) = ON 

Sorting Information (SORT) = ON 

SQL Statement Information (STATEMENT) = ON 

Table Activity Information (TABLE) = ON 2012-11-07 15:33:10.888675 
Take Timestamp Information (TIMESTAMP) = ON 2012-11-07 15:20:45.884026 
Unmit OE Work mE Gu Ss T (UOW) = ON 


在 性 能 分 析 时 ， 我 们 将 结合 使 用 快照 监视 器、 管理 视图 和 db2pd 等 监控 工具 。 根 据 性 能 优 
化 实战 经 验 ， 将 特别 侧重 于 下 面 儿 个 方面 : 

e 2x: 包括 缓冲 池 大 小 以 及 命中 率 等 。 

e 锁 : 锁 内 存 的 分 配 情况 、 锁 等 待 发生 次 数 、 死 锁 发 生 次 数 等 。 

e 排序 : 排序 内 存 的 分 配 情 况 、 排 序 洪 出 等 情况 。 

e K: 表 的 冷 热 情况 ， 表 的 大 小 等 ， 特 别 是 对 于 热 小 表 、 热 大 表 、 冷 大 表 要 有 不 同 的 处 
理 办 法 。 

e 分 区 : 合理 使 用 分 区 技术 ， 例 如 表 分 区 和 MDC 分 区 等 ， 对 数据 库 的 性 能 影响 很 大 。 

e AU: 关注 执行 租 询 时 索引 的 使 用 情况 ， 是 人 否 存在 没 用 的 索引 等 。 

e SQL 语句 : 重点 关注 数据 库 运 行 一 段 时 间 内 ， 包 括 忙 时 和 闲 时 ， 特 别 是 执行 时 间 最 多 、 
执行 次 数 最 多 的 前 十 位 SQL 语句 。 这 些 语句 后 续 可 以 从 有 索引 角度 进行 优化 ， 从 锁 的 角 
度 进 行 调整 。 

e Ký: 针对 巨大 表 ， 关 注 压 缩 对 性 能 的 影 啊 。 

e 临时 表 : 关注 临时 表 的 使 用 情况 。 

e SE: 重点 关注 表 的 统计 信息 是 人 否 最 新 ， 不 是 的 话 要 及 时 运行 runstats， 天 注 表 是 否 需 
要 重组 ， 对 需要 重组 的 表 及 时 运行 reorg. 


2.4.3 优化 方法 字 与 计划 


考虑 到 目前 系统 的 情况 ， 自 下 而 上 方法 学 是 比较 适合 的 ， 毕 竟 我 们 没有 参与 过 包括 人 力 资 
源 、 碍 询 分 析 等 业务 系统 的 设计 和 开发 过 程 ， 并 不 深入 了 解 应 用 馆 辑 。 不 过 笠 运 的 是 ， 我 们 可 
以 在 优化 过 程 中 得 到 数据 库 管 理 员 和 应 用 开发 人 员 的 技术 支持 。 

针对 这 个 优化 项 目 ， 核 心 内 容 有 两 个 : 其 一 ， 确 定 优 化 顺序 ， 先 集中 精力 解决 业务 问题 ， 
还 是 从 全 局 调整 开始 ? 其 二 ， 优 化 顺序 确定 后 ， 有 哪些 手段 可 以 融 效 地 解决 这 些 问 题 ? 其 三 ， 
一 个 具体 的 实施 计划 是 什么 样 的 ? 

上 自 先 ， 先 确定 优化 顺序 。 通 党 在 做 性 能 优化 时 ， 顺 序 上 是 有 讲究 的 ， 不 能 一 构 而 论 。 有 的 
优化 项 目 ， 实 施 周 期 很 短 而且 性 能 非 第 严重 ， 客 户 要 求 务必 先 解 决 业务 问题 ， 所 以 只 能 从 业务 
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优化 入 手 ， 数 据 库 全 局 调整 后 续 再 做 : 有 的 优化 项 目 ， 业 务 性 
期 较 长 ， 所 以 可 以 先 对 数据 库 进 行 全 局 调整 ， 随 后 再 对 业务 性 
局 调整 ， 随 后 再 对 各 个 业务 系统 优化 。 

其 次 ， 谈 谈 手 段 。 衣 先 要 进行 “诊断 ”， 要 找到 性 能 瓶 陆 ， 确 定时 间 是 如 何 被 消耗 的 ， 例 
如 多 少时 间 花 在 了 CPU 上 、 多 少时 间 花 在 了 VO 上 ， 问 题 产 生 的 时 间 和 环境 、 问 题 的 症状 等 : 
其 次 是 “ 开 处 方 ”， 即 提出 解决 问题 的 最 可 行 方案 。 

最 后 ， 就 可 以 正式 制定 实施 计划 了 。 如 表 2-6 所 示 ， 首 先 对 数据 库 进 行 全 局 调整 和 优化 ， 
随后 并 行 开 展 人 力 资源 管理 和 奉 询 分 析 的 优化 工作 ， 接 下 来 是 报表 。 另 外 ， 表 2-6 还 列 出 了 系 
统制 接 和 运 维 文 持 ， 这 在 实战 中 应 用 很 多 ， 当 然 这 不 是 本 书 重点 ， 后 文 不 再 菊 述 。 


有 问题 ， 但 是 客户 给 的 实施 周 
各 个 击破 。 这 个 案例 将 首先 全 


表 2-6 优化 时 间 表 


项 目 开始 时 间 持续 时 间 


数据 库 全 局 调整 和 优化 2010-12-1 2010-12-4 4 天 
人 力 资 源 管 理 2010-12-5 2010-12-7 3 天 
查询 分 析 2010-12-8 2010-12-12 57x 


报表 2010-12-13 2010-12-15 3 天 
系统 割 接 2010-12-16 2010-12-18 3 天 
运 维 支 撑 2010-12-19 2010-12-23 5 


"E BE D. 1 
l 
2.5 性 能 优化 
本 贡 将 讲述 这 个 案例 的 详细 优化 过 程 。 这 是 一 个 真实 的 项 目 ， 我 们 在 每 次 调整 前 都 要 准备 
优化 报告 ， 等 客户 签字 确认 后 ， 先 在 测试 环境 验证 ， 随 后 在 客户 DBA 的 配合 下 正式 在 生产 库 
上 实施 。 
2.5.1 全 局 调整 和 优化 
在 全 局 调整 方面 ， 重点 是 存储 规划 和 内 存 参数 调整 。| 除 此 以 外 ， 本 节 还 讲述 了 在 实战 中 应 
用 十 分 广泛 的 表 调 整 ， 即 根据 表 的 冷 热 程度 来 灵活 定义 表 的 存放 位 置 ， 从 而 提升 VO AERE. 
1. 存储 规划 和 调整 
AMERI VO 研 吐 量 是 有 上 限 的 ， 为 了 提升 吞吐 量 ， 可 以 把 多 个 便 盘 放 在 一 起 ， 组 成 伐 


AREN) CRAIDO 来 满足 大 规模 读 写 请 求 。 通 和 常 在 一 个 OLTP 应 用 中 ， 夏 盘 阵 列 的 写 速度 至 少 要 
达到 200 M/s 以 上 ， 这 可 以 通过 dd 命令 来 测试 ， 如 下 所 示 : 


dd if=/dev/zero of-/datal/test.file bs-8192 count-5000000 
5000000+0 records inm 

500000070 records out 

40960000000 bytes (41 GB) copied, 179.411 seconds, 228 MB/s 
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天 于 存储 的 规划 和 调整 ， 请 读者 参考 本 书 第 3 间 。 


2. 内 存 参数 调整 


考 夸 到 便 盘 谈 写 速度 的 限制 ，DB2 需要 用 内 存 来 缓存 磁盘 数据 ， 从 而 捉 高 该 写 速 度 。 在 性 


能 优化 实践 中 ， 需 要 重点 调整 的 内 存 参数 包括 缓冲 池 、 排 序 堆 、 包 缓存 以 及 编目 缓存 等 。 


(1) ZERO B 


对 数据 库 来 说 ， 正 确 的 内 存 配置 非常 重要 ， 首 先是 监控 缓冲 池 。 使 用 “db2pd -db erpdb 
-bufferpools" MS, MARIMEA. PIX *db2pd -db erpdb -bufferpools” 命 令 的 输出 : 


Database Particion 0 ==- Database ERPDB == Active == Up 5 days 23:19:55 == Discere Scb 7) 
14:44:16 

Bufferpools: 

First ACtivyve Pool ID 1 

Max Bufferpool ID 9 

Max Bufferpool ID on Disk 7 

Num Bufferpools 11 

Address ral Name PageSz PA-NumPgs 
NumTbsp PgsToRemov CurrentSz PostAlter SuspndTSCt Automatic 
0x000000000B2F93A0 1 IBMDEFAULTBP 8192 1000 
0 1000 1000 0 True 
0x000000000B2F9840 2 HR DBP 8192 12000 
0 12000 12000 0 True 
0x000000000B2F9CEQ0 3 HR IBP 0192 4000 
4000 4000 0 True 

0x000000000B2FA180 4 ORY DBP 16384 6000 
0 6000 6000 0 True 
0x000000000B2FA620 5 ORY IBP 16384 4000 
0 4000 4000 0 True 
0x000000000B2FAACO 6 RPT DBP 32768 8000 
0 8000 8000 0 True 
0x000000000B2FAF60 7 REPT IBP 32768 6000 
0 6000 6000 0 True 
0x000000000B2F8120 4096 IBMSYSTEMBP4K 4096 16 
0 16 16 0 False 
0x000000000B2F85C0 4097 IBMSYSTEMBP8K 8192 16 
0 16 16 0 False 
0x000000000B2F8A60 4098 IBMSYSTEMBP16K 16384 16 
0 16 16 0 False 
0x000000000B2F8F00 4099 IBMSYSTEMBP32K 32768 16 
0 16 16 0 False 


Burtrerpool Statistics for all buftferpoolsg 


BPID DatLRds DatPRds 


HLCRaTLO TmprdxLResS TnoldxePRos HitRatlio 


(when BUFFERPOOL monitor switch is ON): 


HitRatio TmpDatLRds TmpDatPRds HitRatio IdxLRds 


1 14223542603 13827022 90.260% 14220952 609871 
99.003% 1736 O 100.00% 
2 d: 205 105 39.31% 0 
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0 0 00.00% 

E 25935801 19642627 23.08% 0 0 00.003 0 0 

00.00% 0 0 00.003 

4 SB IS 1402600 76.01% 0 0 00.003 0 0 

00.00% 0 0 00.003 

5 56073212 1471370 59.943 0 0 00.003 0 0 

00.00% 0 0 00.003 

6 47199093 1309121 72.72% 0 0 00.003 3108461 40819 
98.69% 0 0 00.003 

7 511513 2 9.9 I 54.42% 0 0 00.003 28300983 174 
100,00% 0 0 00.00% 

4096 0 0 00.003 0 0 00.003 0 0 00.003 
0 0 00.003 

4097 0 0 00.003 0 0 00.003 0 0 00.003 
0 0 00.00% 

4098 0 0 00.003 0 0 00.003 0 0 00.003 
0 0 00.003 

4099 0 0 00.003 0 0 00.003 0 0 00.003 
0 0 00.003 


从 上 面 输出 中 可 以 看 到 各 个 缓冲 池 的 页 面 分 配 情况 ， 如 表 2-7 WMR, 8E ERI 2) BICIS] 94 
面 并 不 多 ， 命 中 率 也 比较 低 。 


表 2-7 缓冲 池 页 面 分 配 情况 和 命中 率 
缓冲 池 分 配 页 面 个 数 Automatic 
HR DBP 12000 39.31% 


是 
HR IBP 23.08% 征 
ORY DBP " 
ORY IBP 59.94% 古 
RPT DBP 72.72% 古 
RPT IBP 54.42% ^E 


全 小 技巧 : 使 用 国定 大 小 的 缓冲 池 
运行 DB2 经 营 分 析 库 的 x3850 服务 器 有 256GB 内 存 ， 针 对 当前 应 用 来 说 足够 多 了 ， 
旦 是 假如 开局 内 存 自 调 优 的 话 ，DB2 需要 根据 负载 的 情况 自动 为 缓冲 池 分 配 或 者 回收 内 
存 ， 这 对 内 存 足 够 多 的 系统 来 说 其 实 未 必 实 用 。 我 们 可 以 自己 为 每 个 缓冲 池 配 置 固定 大 
小 的 内 存 ， 避 免 DB2 频繁 动态 分 配 或 者 回收 内 存 。 


首先 ， 使 用 下 面 的 命令 碍 看 内 存 目 调 优 《STMM) 是 否 打 开 : 


lerpinstlaPrimartvNode-2sqsdb2 get dob ctg ror erpdb| grep =i "self" 
目 调 整 内 存 (SELF TUNING MEM) = ON 


ME, RAFTE NEKEEN E E, Mese S6 AL 6 B S VCI JT 4 EA Tees TE 


能 。 经 过 监控 发 现 ， 当 前 系统 可 用 内 存 为 150GB 左右 , 将 其 中 的 50% 即 大 约 70GB 固定 分 配给 
DB2 缓冲 池 使 用 ， 如 表 2-8 所 示 ，HR DBP, QRY DBP 和 RPT DBP 规划 为 16 GB, HR IBP, 
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QRY IBP 和 RPT IBP 规划 为 8 GB， 总 的 缓冲 池 大 小 为 72 GB. 


表 2-8 缓冲 池 尺 寸 规 划 
缓冲 池 ( 非 自动 调整 ) 
缓冲 池 名 id 
HR DBP PERE 人 力 资 源 模块 数据 绥 冲 池 
HR IBP AJ VES EUR y| Epit 
QRY DBP | ik | 16GB | 分 析 查 询 模块 数据 缓冲 池 
QRY IBP lk igsgs 4) br ER pL EUER | DER 
RPT DBP | xK | 1GB -— Tice Bep S Epit 


RPT IBP | ok | 8GB | Hielo 


以 DBA 权限 ， 执 行 下 面 建立 缓冲 池 的 语句 : 


==16 GB 

CREATE BUFPERPOOL “HR SIE SIZE 2048000 PAGESIZE T NOT EXTENDED STORAGE 
es 

CREATE BUFPERPOOL “HR IBP" SIZE 1024000 PAGESIZE 6192 NOT EXTENDED STORAGE 
==16 GB 

CREATE BUFFERPOOL "ỌRY DBP" SIZE 1024000 PAGESIZE 16384 NOT EXTENDED STORAGE 
=-9 GB 

CREATE BUFPERPOOL ORY IBPS SIZE 512000 PAGESIZE 163584 NOT EXTENDED STORAGE 
==16 GB 

CREATE BUFPFERPOOL RPT DBP“ SIZE 512000 PAGESIZE 32768 NOT EXTENDED STORAGE 
=- GB 


CREATE BUFFERPOOL “RPT IBPY SIZE 2560000 PAGESIZE 327668 NOT EXTENDED STORAGE 


再 次 使 用 “db2pd -db erpdb -bufferpools" ME, 可 用 看 到 内 存 已 经 按照 狐 的 规划 正确 分 配 ， 
男 外 ， 绥 冲 池 的 命中 率 也 达到 了 99.99%~100%。 


Database Partition 0 == Database ERPDB == Active == Up 3 days 23:19:55 == Date 2015=01=27 


14:44:16 

Bufferpools: 

First Active Pool ID 1 

Max Bufferpool ID 7 

Max Bufferpool ID on Disk 7 

Num Bufferpools 11 

Address Id Name PageSz PA-NumPgs BA-NumPgs BlkSize 
NumTbsp PgsToRemov CurrentSz PostAlter SuspndTSCt Automatic 

0x000000000B2F93A0 1 IBMDEFAULTBP 3192 1000 0 0 5 
0 1000 1000 0 True 

0x000000000B2F9840 2 HR DBP 8192 2048000 0 0 1 
0 2048000 2048000 0 False 

0x000000000B2F9CE0 3 AR IBE 8192 1024000 0 0 1 
0 1024000 1024000 0 False 

0x000000000B2FA180 4 ORY DBE 16384 1024000 0 0 1 
0 1024000 1024000 0 False 
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0x000000000B2FA620 5 ORY IBP 16384 512000 0 0 1 
0 512000 512000 0 False 

0x000000000B2FAACO 6 EPTODBE 32768 512000 0 0 1 
0 512000 512000 0 False 

0x000000000B2FAF60 7 RPT IBE 32168 256000 0 0 1 
0 256000 256000 0 False 

0x000000000B2F8120 4096 IBMSYSTEMBP4K 4096 16 0 0 0 
0 16 16 0 False 

0x000000000B2F85C0 4097 IBMSYSTEMBP8K 6192 16 0 0 0 
0 16 16 0 False 

0x000000000B2F8A60 4098 IBMSYSTEMBPI16K 16384 16 0 0 0 
0 16 16 0 False 

Ox000000000B2F8F00 4099 IBMSYSTENMBB32K 32768 16 0 0 0 
0 16 16 0 False 


Buftrerpool statistics for all bufferpools (when BUFEPFERPOOL monitor SwWlEicn LS ON) < 


BPID DatLRds DatPRds HitRatio TmpDatLRds TmpDatPRds HitRatio IdxLRds IdxPRds 
HLCRaTLO TmprdxLResS TnoldxPRos HitRatlio 

1 14223542603 138276022 90.267 14220952 909671 94.31% 127559113 127151% 
99.00% 1736 0 100.00% 

2 4590154 0 100% 0 0 00.00% 20 6 
710.003 0 0 00.003 

3 16593 0 100$ 0 0 00. 00% 0 0 00.00% 0 
0 00.003 

4 2804135 600 99.993 0 0 00.003 0 0 
00.003 0 0 00.003 

5 167212 70 99.993 0 0 00.003 0 0 
00.003 0 0 00.003 

6 288793 30 99.99% 0 0 00.005 51068461 40819 
98- 09% 0 0 00.003 

7 112513 3 99.99% 0 0 00.00% 280300963 174 
100.003% 0 0 00.003 

4096 0 0 00.003 0 0 00.00% 0 0 
Quos 0 0 00.003 

4097 0 0 00.003 0 0 00.00% 0 0 
00.003 0 0 00.003 

4098 0 0 00.003 0 0 00.00% 0 0 
00.003 0 0 00.003 

4099 0 0 00.003 0 0 00.00% 0 0 
QOIS 0 0 00.003 


(2) 排序 堆 配置 
DB2 中 的 排序 分 为 共享 排序 和 私有 排序 ,这 主要 是 由 SHEAPTHRES 这 个 实例 级 参数 控制 。 
如 果 SHEAPTHRES 被 设置 为 0 值 ， 则 使 用 共享 排序 ， 这 时 SHEAPTHRES SHR 将 起 作用 ， 其 
值 代 表 共 享 排序 的 最 大 内 存 限 制 ; 如 果 sheapthres 被 设置 为 非 0 值 , 表示 DB2 将 使 用 私有 排序 ， 
排序 内 存在 代理 中 分 配 ，SORTHEAP 参数 此 时 则 规定 了 每 个 私有 排序 最 多 使 用 的 内 存量 。 
首先 使 用 快照 命令 ， 查 看 排序 溢出 情况 。 从 下 面 可 以 看 出 ， 总 计 8673578 次 排序 ， 但 是 发 
^E f 208840 次 溢出 ， 明 显 偏 多 。 
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[erpinstl@PrimaryNode-2 sh db2 get 


已 分 配 的 专用 排序 堆 总 数 
已 分 配 的 共识 排序 堆 总 数 
共享 排序 堆 高 水 位 标记 
后 阅 值 排序 《共享 内 存 ) 
总 计 排 序 

总 计 排 序 时 间 《〈 肋 秘 ) 
排序 溢出 

活动 排序 数 


snapshot for db on erpdb 


0 

920752 
90 
= 8673578 
11045303 


208840 


那么 怎么 来 调整 呢 ? 首先 ， 先 看 一 下 原来 的 设置 ，SHEAPTHRES 设置 为 0， 表示 启用 共享 
排序 ， 但 是 SHEAPTHRES SHR 为 AUTOMATIC(2048), SORTHEAP 为 AUTOMATIC(1024)， 


明显 俩 小 了 ， 无 法 满足 应 用 的 需求 。 


lerpinstilPrimaryNode=2 =~] 52 get dbm efg | grep =i "Sort" 

Sort heap threshold (4KB) (SHEAPTHRES) = O0 
lerpinstilPrimaryNode=2 ~] 2 get do Ci | grep =i "SOFt! 

SOrt heap thres for share sorte (AKB) (SHEAPTHRES SHR) = AUTOMATIC (2048) 
Sort list heap (4KB) (COREEA TOTAS COA 


增加 排序 堆 大 小 的 命令 如 下 : 


rr le e ma ae 2 e c2 rss. clo (e: Tm eeegeues ac 10594010 


DB20000I 


The UPDATE DATABASE CONFIGURATION command completed successfully. 


lerpinsti@lPrimaryNode=2 ~|S 2 update do cfg using sortheap 819200 


DB20000I 


The UPDATE DATABASE CONFIGURATION command completed successfully. 


调整 后 的 大 小 如 下 ， 运 行 一 段 时 间 重 痢 执 行 快照 命令 ， 发 现 排序 溢出 次 数 大 大 减少 了 ， 从 


原来 的 208840 次 减少 为 2312 次 。 


[erpinstl@PrimaryNode-2 ~]s$ db2 get 


已 分 配 的 专用 排序 堆 总 数 
已 分 配 的 共享 排序 堆 总 数 
共享 排序 堆 高 水 位 标记 
后 阅 值 排序 《共享 内 存 ) 
总 计 排 序 

总 计 排 序 时 间 《〈 军 秘 ) 
排序 溢出 

活动 排序 数 


(3) 包 绥 存 配 置 


snapshot for lo on erpalo 


920732 
90 
= 717534 
901304 


2312 


包 绥 存 你 存 了 最 近 使 用 的 SQL 语句 或 者 存储 过 程 的 得 询 计 划 ,， 如 打 有 相同 的 得 询 ， 可 以 直 
接 从 包 绥 存 中 获得 得 询 计 划 , 而 不 需要 重新 编译 .所 以 , 包 缓存 的 大 小 设 定 非 党 重要 .对 于 OLAP 


应 用 来 说 ， 重 复 的 查询 相对 较 少 ， 而 且 查 询 语 句 相 对 较 大 ， 有 少量 的 溢出 应 该 不 是 问题 ， 但 是 
对 于 OLTP 来 说 ， 就 是 很 大 的 问题 了 。 这 可 以 通过 快照 命令 获取 包 绥 存 洲 出 情况 ， 如 下 所 示 ， 


发 现 有 2103 次 溢出 。 
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lerpinsti@0PrimaryNocde=2 二 | 2 get snapshot for cio on erpdio 


Tz FF 11 eg i oa = 6705019 


a) 

程序 包 高 速 缓存 插入 = 783087 
程序 包 高 速 缓存 浇 出 = 2103 

程序 包 高 速 缓存 高 水 位 标记 《〈 以 字 节 计 ) = 407662554 
应 用 程序 节 碍 找 = 13403852 
应 用 程序 节 插 入 = 944293 


AA JRI PCKCACHESZ KA, HEN AUTOMATIC(1024), Hj Sj fij]: 


lerpinstilPrimaryNocde=2 d db2 get db cfg | grep =i "package" 
Package cache size (4KB) (POKCACHESA) = AUTOMATIC(1024) 


增加 包 缓 存 大 小 ， 从 1024 增加 为 102400: 


lerpinstli@QPrimaryNoce=2 ~] dd2 update clo cfg using POKCACKHESZ 102400 
DB20000I The UPDATE DATABASE CONFIGURATION command completed successfully. 


运行 一 段 时 间 后 ， 香 新 执行 快照 命令 ， 发 现 洲 出 次 数 大 为 减 小 ， 只 有 103 1X 


[erpinstl@PrimaryNode-2 ~] $ db2 get snapshot for db on erpdb 


ETA E XE £F Ex MEI 


= 5203029 
FEJT E rea 38 E Tr Ti NC = 1083087 
程序 包 高 速 缓存 溢出 = 103 
程序 包 高 速 缓存 高 水 位 标记 【以 字 节 计 ) 22052 11 
应 用 程序 节 查 找 = 12603752 
应 用 程序 节 插 入 = 834201 


(4) 编目 绥 存 配置 
编目 缓存 包含 最 近 用 到 的 数据 库 编目 信息 ， 包 括 表 的 定义 、 统 计 信 息 和 权限 等 。 这 可 以 通 
过 快照 命令 获取 包 组 存 溢 出 情况 ， 如 下 所 示 ， 发 现 有 901 次 溢出 : 


lerpinsti@lPrimaryNocde=2 =~]$ 2 get snapshot for clo on erpdio 


目录 高 速 缓存 查询 —- 2626178 


目录 高 速 缓存 插入 — 321 
目录 高 速 缓存 溢出 = 901 
目录 高 速 缓存 高 水 位 标记 = 1554280 


查看 原先 CATALOGCACHE SZ 设置 ， 其 值 为 S12， 明 显 俩 小 ， 导 致 多 次 溢出 : 


[erpinsti@0PrimaryNocde=2 ~] db2 get db efg | grep =i "catalog" 
Catalogi a hee izen eB) (CATALOGCACHET TOA) dE 


增加 编目 缓存 大 小 ， 从 512 增加 为 102400: 


[erpinst a ames Node 2 | 9 ccce uS mE RUNE OG CHEER 
DB200001 The UPDATE DATABASE CONFIGURATION command completed successfully. 
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运行 一 段 时 间 后 ， 香 新 执行 快照 命令 ， 友 现 洲 出 次 数 减 为 0 次 。 


lerpinsti@lPrimaryNocde=2 ~|S 2 get snapshot for clo on erDos 


目录 高 速 缓存 查询 —- 1526178 


目录 高 速 缓存 插入 = 212 
目录 高 速 缓存 溢出 = 0 
目录 高 速 缓存 高 水 位 标记 - 1256193 


3. 根据 冷 热 程度 灵活 调整 表 


对 性 能 优化 来 说 ， 表 的 定义 通 第 不 是 DBA 关注 的 重点 ， 他 们 最 关注 表 的 冷 热 程度 ， 其 次 
是 表 的 大 小 。 如 表 2-9 所 示 ， 可 以 分 为 冷 大 表 、 热 大 表 、 冷 小 表 和 热 小 表 。 在 性 能 ” 调 优 中 ， 
最 关注 的 是 热 大 表 和 热 小 表 。 


表 2-9 缓冲 池 页 面 分 配 情况 和 命中 率 
z " 
^ "e 


热 热 大 表 热 小 表 


那么 怎么 来 找到 数据 库 中 的 热 表 呢 ? 可 以 通过 “db2pd -db erpdb -tebstats ”命令 碍 看 数据 库 
运行 一 段 时 间 内 ， 表 的 大 小 和 冷 热情 况 ， 如 下 所 示 ，CHARGE HISTORY 有 51492320 个 页 面 ， 
显然 是 大 表 了 ， 合 询 次 数 为 9269223， 插 入 次 数 为 3139368， 更 狐 次 数 为 5844121， 删 除 次 数 为 
720323， 所 以 也 是 热 表 了 ， 总 体 来 看 ，CHARGE HISTORY 是 一 个 供 频 繁 查询 、 插 入 、 更 新 和 
删除 的 热 大 表 。 

另外 ， 也 关注 一 下 表 CHARGEDETERMINATION， 是 个 小 表 ， 只 有 5247 个 页 面 ， 但 是 对 
这 个 表 的 查询 很 多 ， 达 到 了 9701900 次 ， 但 是 对 这 个 表 没 有 其 他 插入 、 更 新 和 删除 操作 ， 也 恕 
是 说 这 个 表 是 一 个 只 供 查 询 的 热 小 表 。 

[erpinstlG8PrimaryNode-2 -]$ db2pd -db erpdb -tcbstats 


Database Partition 0 == Database ERPDB == Active =-= Up 5 days 22:49:19 == Date 2013=01=27 
TAs :0) 


TOB Table Informacions 


Address TbspaceID TableID PartID MasterTbs MasterTab TableName 
SchemaNm ObjClass DatasSize LfSize LobSize XMLSize 
0x00000003CE701828 4 L3 n/a 4 1/5; CHARGEDETERMINATION 
ORY Perm 5267 0 0 0 
0x00000003AEA4CODA8 4 15 n/a 4 15 CHARGE MISTORY 
ORY Perm 51492320 0 0 0 


TCB Table SE STET 
Address TableName scans (ODE PgReorgs NoChgUpdts Reads 
FscrUpdates Inserts Updates Deletes OvFlReads OvFlCrtes 


0x00000003CE701828 CHARGEDETERMINATION 9 21610676 0 0 
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9701900 0 O 0 0 0 O 
0x00000003AE4CO0DA8 CHARGE HISTORY 0 97035812 63737 0 
9269223 Z5 Sl 5139568 5044121 7120323 0 0 


(1) 调整 热 大 表 CHARGE HISTORY 


Ht. A— F CHARGE HISTORY WREX, FRR, HP CHARGEIDENTIFIER 
为 主键 ， 如 下 所 示 。 男 外 ， 和 DBA 沟通 过 ， 这 个 表 中 的 字段 BILLINGPERIODENDDATE 表示 
每 天 记录 执行 操作 时 的 月 份 。 
CREATE TABLE "QRY"."CHARGE HISTORY" ( 
KORARECEATD ENA EIN Ss BLIGINT NOT NULL ; 


"CHARGEAMOUNTINVOICEABLE" DOUBLE NOT NULL 
"CHARGEAMOUNTOPPORTUNITY" DOUBLE NOT NULL 


, 


, 


"WORKSTATIONIDENTIFIER" CHAR(10) NOT NULL 
"ORIGINALEXTERNALINVOICENUMBER" CHAR (30) 
"BILLINGPERIODENDDATE" DATE ) 

IN ORY DTS” INDEX IN ORY ITS% 


, 


, 


ALTER TABLE "ORY”. "CHAARGE HISTORY™ 
ADD PRIMARY KEY 
(“CHARGELDENTIELER")» 


那么 怎么 解决 这 个 问题 呢 ? CHARGE HISTORY 改 为 分 区 表 ， 例 如 以 BILLINGPERIODENDDATE 
作为 表 分 区 的 键 值 ， 按 月 进行 分 区 ， 将 很 少 用 的 数据 放 到 慢 速 的 内 置 硬盘 《路径 为 “mhdd”) ， 
将 有 时 会 用 到 的 数据 放 到 磁盘 阵列 〈 路 径 为 “mraid”) ， 将 频繁 使 用 的 数据 放 到 固态 盘 〈 路 径 
Aj */ssd" 5 。 

先 看 看 在 DB2 V9.7 中 是 怎么 实现 的 : 


CREATE BUFFERPOOL "cold bp" SIZE 128000 PAGESIZE 8192 NOT EXTENDED STORAGE; 
CREATE BUFFERPOOL "warm bp" SIZE 128000 PAGESIZE 8192 NOT EXTENDED STORAGE; 
CREATE BUFFERPOOL "hot bp" SIZE 128000 PAGESIZE 8192 NOT EXTENDED STORAGE; 
CREATE LARGE TABLESPACE "tbsp 2012 4Q" PAGESIZE 8192 MANAGED BY DATABASE 
USING (FILE '/had/20124001 .DAT'2097152, 
Ee ee ON A DA 0 
oe/ 0T SAO DA 
ET ee OA A HOY TATE 
) 
EXTENTSIZE 32 
PREFETCHSIZE 64 
BUPPERPOOL COLE loe 
OVERHEAD 7.500000 
TRANSFERRATE 0.060000 
NO FILE SYSTEM CACHING; 
CREATE LARGE TABLESPACE "tbsp 2013 1Q" PAGESIZE 8192 MANAGED BY DATABASE 
USTG Combe qae rad 29 db TOO DT AIO E PUE 
Ig; - rard C015) 1012; c Iovem v 2000 3 1L. 
Ig Tg raid 01.9) dEOT9SI o vea 21000 0 152. 
Ig Tg V rard 2101.5) 11012. DET v 2:300 3 1E 7 
) 
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EXTENTSIZE 32 
PREFETCHSIZE 64 
BUFFERPOOL warm bp 
OVERHEAD 7.500000 
TRANSFERRATE 0.060000 
NO FILE SYSTEM CACHING; 

CREATE LARGE TABLESPACE "tbsp 2013 2Q" PAGESIZE 8192 MANAGED BY DATABASE 
USING (FILE '/hdd/20132001 .DAT'2097152, 
ID Vo stereo Z 3:9 0102/5 e qu 296) HIS vm 
Ig EIE v ato reU 2:40)35 0 Die V0 aS m 
plus ducc AIDE dq DOE 

) 
EXTENTSIZE 32 
PREFETCHSIZE 64 
BUFFERPOOL hot bp 
OVERHEAD 7.500000 
TRANSFERRATE 0.060000 


ft DB2 V10 中 ， 实 现 的 方法 将 更 为 简单 ， 如 下 所 示 : 

-- DB2 V10 的 办 法 

(UEM OSEE SCOPO AI 

CREATE STOGROUP sg warm ON '/raid' 

CREATE STOGROUP sg warm ON '/ssd' 

CREATE TABLESPACE tbsp 2012 4Q USING STOGROUP sg cold 
CREATE TABLESPACE tbsp 2013 1Q USING STOGROUP sg warm 
CREATE TABLESPACE tbsp 2013 2Q USING STOGROUP sg hot 


最 终 , 将 CHARGE HISTORY 改造 为 分 区 表 后 的 DDL 定义 如 下 所 示 , BILLINGPERIODENDDATE 
为 分 区 键 ， 其 中 2012 年 第 4 季度 的 数据 存放 在 2012 tbsp 4Q 表 空 间 上 ，2013 年 第 1 季度 的 数 
据 存 放 在 2013 tbsp 1Q KTHE, 2013 年 第 2 季度 的 数据 存放 在 2013 tbsp_2Q KTHE. 

CREATE TABLE “ORY". "CHARGE HISTORY” ( 
WCEARGEEILDENLTLPILERY BIGINYT NO NULL ; 


"CHARGEAMOUNTINVOICEABLE" DOUBLE NOT NULL , 
"CHARGEAMOUNTOPPORTUNITY" DOUBLE NOT NULL , 


WORKSTATITONIDENTIPIER” CHAR (10) NOT NULG ; 
"ORIGINALEXTERNALINVOICENUMBER" CHAR(30) , 

"BILLINGPERIODENDDATE" DATE ) 

INDEX IN YORY ITS" PARTITION BY RANGE (“B ILLINGPERIODENDDATEN NULLS PERSE) 
(PART PARTO” STARTING (MINVALUE) IN "2012 tosp RU 

PART "PARTI™ STARTING ("2012=10=01") IN "2012 _ tobsp 40", 


IN "2013 tbsp 20", 

PART "PARTO" STARTING (“20135-05701 IN "2013 tbsp 20", 

PART "PARTS" STARTING (“2013=06=01 IN "2013 tbsp 20", 

PART YPARTLOY STARTING ("2013=07=01") ENDING ("2013-08701") XC ID SINN 
“2013 _ tosp 20") 


PART "PART2" STARTING ("2012=11=01") IN "2012 _ tobsp 40", 
PART PARTS” STARTING ("2012=12=01") IN "2012 _ tosp 40", 
PART UPARTA" STARTING ("2013=01=01") IN "2013 tbsp 10", 
PART "PARTS™” STARTING ("2013=02=01") IN "2013 tbsp 10", 
PART "PARTO™ STARTING ("2013=03=01") IN "2013 tbsp 10", 

) 

) 

) 


( 
( 
( 
( 
( 
PART RART OTARTING( 20I U4 0 
( 
( 
G 
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(2) 调整 热 小 表 CHARGEDETERMINATION 
首先 查看 一 下 这 个 表 定 义 ， 如 下 所 示 : 


CREATE TABLE "ỌRY"."CHARGEDETERMINATION" ( 
"ACTIVERECORD" CHAR(1) NOT NULL , 
"AIRCRAFTCLASS" CHAR(2) NOT NULL WITH DEFAULT '*' , 
"ENGINETYPE" CHAR(1) NOT NULE WITH DEFAULT 1al; 
"ATRCRAPFPTOPERATOR" CHAR(6) NOT NULL WITH DEFAULT YU 
"AIRCRAFTOPERATORTYPE" CHAR(4) NOT NULL WITH DEFAULT '*' 
URODRCBARTIDYPRU CHAR(15) NOT NULL WITH DEPAUL Ysu 
"AIRCRAFTUSAGE" CHAR(2) NOT NULL , 
"ANCILLARYFLIGHTTYPE”Y CHAR (2) NOT NULL WITH DEFAULT YY ; 
"ANCILLARYROUTETYPE" CHAR(1) NOT NULL , 
"LOWERBOUNDARY1" INTEGER , 
"TU PINEBOUUNIAEYIS INTEGER ; 
"LOWERBOUNDARY2" INTEGER , 
"UPPERBOUNDARY2" INTEGER , 
"CALCULATIONREFERENCE™ INTEGER NOT NULL , 
"CHANGEREASON" CHAR(4) , 
"NOTES" VARCHAR(1000) , 
"DATAINTEGRITYINDICATOR" CHAR (LI) NOT NULL , 
"DATETIMESTAMP" TIMESTAMP NOT NULL WITH DEFAULT CURRENT TIMESTAMP , 
"ENDDATE” 工 IMESTAMP NOT NULL , 
"“"STARTDATE" TIMESTAMP NOT NULL , 
"ILEDELIGHTRULES” CHAR(2) NOT NULL ; 
"FINALFLIGATRULES™ CHAR(2) NOT NULL ; 
"PLIGHTTYPELCAO™Y CHAR(3) NOT NULL WITH DEFAULT “Y=! 7 
"NOLISECATEGORYY CHAR(8) NOT NULL WITH DEFAULT "Y 
"NUMBERENGINES™ CHAR(1) NOT NULL WITH DEFAULT "al , 
"PROGRAMIDENTIFIER" CHAR(10) NOT NULL , 
"ROUTETYPE”Y CHAR (2) NOT NULL WITH DEFAULT YY 
"SERYICECODE” CHAR(10) NOT NULL ; 
"SERYICELEVELCODE” CHAR(2) NOT NULL WITH DEFAULT YU 
"SERVICELOCATION”" CHAR(6) NOT NULL WITH DEFAULT "wY ) 
"SERYVICEBPROVIDER CHAR(8) N ON 
"TICKETABLE™ CHAR(1) NOT NULL WITH DEFAULT 'N' , 
TICKETCLIPS™Y INTEGER WITH DEFAULT O ; 
INI ON DN NO 
SE NN NOT NULL ; 
"WNORKSTATIONIDENTIFIER" CHAR(10) NOT NULL ) 
IN “ORY DTS™ INDEX IN “ORY ITS™ 


ALTER TABLE "ORY"."CHARGEDETERMINATION" 
ADD PRIMARY KEY 
("SERVICECODEY". 
"SERVICEBROVIDERY" 
"STARTDATE") 


接 下 来 ， 从 管理 视图 “sysibmadm.snapdyn sql” 中 查询 一 下 排名 前 十 位 执行 时 间 最 多 的 查询 
语句 , 可 以 看 到 “select ... from QRY.CHARGEDETERMINATION q1 where (q1."SERVICECODE" 
=?) and (q1."SERVICEPROVIDER" =?) and (q1."STARTDATE" <=?) ”这 条 语句 是 执行 时 
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间 最 长 的 。 如 下 所 示 : 


select NUM EXECUTIONS, TOTAL EXEC TIME, STMT TEXT trom sysibmacm.snapelyn saql order 
by totaltime desc fetch first 10 rows only 
NUM EXECUTTIONS TOTAL EXEC TIME STMT TEXT 


iniu e E 6866230 201235 select ql."ACTIVERECORD", 

ql. "ATRCRAFTCLASS", GD "ENGINETYPE", ql.“ ATRCRAFTOPERATOR", 
ql."AIRCRAFTOPERATORTYPE", ql."“"AIRCRAFTTYPE", ql."AIRCRAFTUSAGE", 

GL. “ANCILLIARY PLIGHTTYPE";, Gol, “ANCLILLARYROUTELIYPEM, GL- VLOWERBOUNDARVILY 

al- "UPPERBOUNDARYI”, ql.” LOWERBOUNDARY2",; Q1, "UPPERBOUNDARY2",; 
OAC NR Ne C ANC ERENS ONK NOS 

ql. DATAINTEGRITYINDICATOR",;, gl. "DATETIMESTAMP";, gl." TENDDATE",;, ql." STARTDATEY,; 
GL" PILEDPLIGHTRULES”;, QL, SIE TER USER TRIES DRIED o GL," PLIGHIPPYPEITCAO™ ,; 
comp sS SUI RICE QL- “NUMBERENGINES”;, GL,“ PROGRAMIDENTIPIER”;, GL, V ROUTETYIPEY, 
GL" EE NO RUDI GL," SERVICELEVELCODE”, Gİ," SERYICELOCATION", GÍ VSERVICEPROVIDERY I 
GL “TICKETABLE”Y,;, QL, ”TICKETCLIPS™”;, Qİ, VUNIQUEIDENTIPLIER”;, č GL o SERES ES SERRE 
ql1."WORKSTATIONIDENTIFIER" from QRY.CHARGEDETERMINATION ql where ( q1."SERVICECODE" = ?) 
and ( ql." SERVICEPROVIDER" = ?) and Qa b YSTARTDATEY <= ?) 


那么 怎么 解决 这 个 问题 呢 ? 在 数据 库 中 对 这 种 静态 热 小 表 执 行 千 万 次 得 询 ， 对 性 能 有 影 
啊 ， 有 时 候 会 成 为 瓶 氏 。 下 面 的 方法 是 重 构 应 用 来 解决 ， 即 在 应 用 中 缓存 这 个 表 ， 从 而 避免 对 
AE TERATAK E A WERE 

如 下 所 示 的 示意 代码 ， 使 用 Java 类 ChargeDeterminationCache 封装 对 表 ChargeDetermination 
的 操作 。 其 中 使 用 hashmap 保存 表 CHARGEDETERMINATION 中 的 数据 ,其 中 方法 initializeData 
用 来 初始 化 表 中 数据 到 hashmap 中 ， 方 法 getChargeDeterminationList 相当 于 上 述 的 SQL 查询 。 


public class ChargeDeterminationCache { 


private static ChargeDeterminationCache instance; 


// 使 用 hashmap 保存 表 CHARGEDETERMINATION 中 的 数据 


private HashMap«String, List«Chargedetermination»» chargeDeterminationMap; 
private ChargeDeterminationCache() { 


initializeData ()5; 


public HashMap«cString, List«Chargedetermination»^» getCache() { 


return chargeDeterminationMap; 


/*** 

调用 这 个 方法 ， 相 当 于 执行 上 述 查 询 select ... from QRY.CHARGEDETERMINATION ql where 

( q1."SERVICECODE" - ?) and ( q1."SERVICEPROVIDER" - ?) and ( q1."STARTDATE" 
<= 2) 

XOT 


public static List«Chargedetermination» getChargeDeterminationList( 


String serviceCode, String serviceProvider, Timestamp when) 
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throws FinderException { 
HashMap«String, List«Chargedetermination»» chargeDeterminationMap = 
getInstance() 


.getCache(); 


String key = serviceProvider.trim() + serviceCode.trim(); 
if (chargeDeterminationMap.containsKey(key)) { 
List«Chargedetermination» result = new 


ArrayList«Chargedetermination»(); 
List«Chargedetermination» list - chargeDeterminationMap.get(key); 
for (Chargedetermination dto : list) { 
if (dto.getStartDate().compareTo(when) <= 0 
&& dto.getEndDate().compareTo(when) >= 0) { 
result.add(dto); 


} 
lt (result.size() > 0) 4 


return result; 


) 
throw new FinderException(); 

) 

/ /将 CHARGEDETERMINATION 表 中 数据 初始 化 到 hashmap 中 

private void initializeData() { 
chargeDeterminationMap = new HashMap<String, List<Chargedetermination>>(); 
Connection conn = null; 
Statement stmt = null; 
ResultSet rs = null; 


trey 1{ 
conn = getConnection(); 
stmt = CONN, Createstatement |), 
ES = EME 
.executeQuery("select * from CHARGEDETERMINATION"); 
while (rs.next()) 1 


Chargedetermination chargedetermination = new Chargedetermination( 


ios c getString("activyverecora") ， 


rs- -getstringl"aircraftelass™) ,; 


Ww 


rs.getString("enginetype"), 


puse eS le ena na 


pouch ee en 


rs getsrtring l airceraftusage™) ; 


PS- EtStr1ing 


( 

( 

( 

( 

rs- getetring ("aircraft toperatortype™) ,; 

( 

( 
(vanclillaryfliohttyoe"); 
( 


Sele eS le ne ne nn 下 


rs. gercrine ("LlowerboundaryL™) , 
rs.getInt ("upperboundaryl"), 
rs. getIint ("lowerboundarcy2™ ) 
rs eet (Vupperbouncdary2™) 
rs.getInt("calculationreference"), 


rs. getsrcring (Y changereason™) 

rs- GetString ("notes") 

£8. OtString ("oatalnteorlity1indlicator") . 
rs.getTimestamp ("datetimestamp"), 


rs.getTimestamp("enddate"), 
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rs. getTimestamo ("startdate™) , 
”"filedfligatrules™), 
Finali ligatcrules™) , 


E.GEtStr1ingd 
quee cue SUCI EO 
rs- getstringl"fElighttypeicao") 
rs.getString("noisecategory"), 
rs.getString("numberengines"), 
rs- getertring t programidentifier™) ,; 
rs- getstring l" seryicecoce™") cring) ， 
rs.getString("servicelevelcode"), 
rs- getsrtring l" seryicelocation™) , 


8. GetStr1ing 


( 
( 
( 
( 
( 
( 
rs.getSstring ("routetype"), 
( 
( 
( 
("seryiceproyvider") trim) p 
( 


rs- gertrortring (Y ticketable") , 
rs- getIint ("ticketelips™) ,; 
rs- getIint ("unigqueicdentifier™") , 
rs- getsrtring l" usericdentifier") , 
rs.getString("workstationidentifier")); 
String key = chargedetermination.getServiceProvider() 
+ chargedetermination.getServiceCode(); 
if (chargeDeterminationMap.containsKey(key)) { 
List«Chargedetermination» chargedeterminations - 


chargeDeterminationMap 


-get (key); 
chargedeterminations.add(chargedetermination); 
) else { 
List«Chargedetermination» chargedeterminations - new 


ArrayList«Chargedetermination»(); 
chargedeterminations.add(chargedetermination); 


chargeDeterminationMap.put(key, chargedeterminations); 


l catecn (SOLEXxCeption e) 4 
e.printStackTrace(); 
}finally{ 
try { 
qusc muse cse 
LE (Stme!=null) stmnc.Close()? 
if (CoOnnl!=null)eConn.GlOoOse()? 
l catch (SOLEXxCeption e) 4 


e.printStackTrace(); 


) 


2.5.2 人力 资源 模块 优化 


在 本 书 1.4.6 小 下 ， 我 们 谈 到 “懒惰 系统 ”问题 。 业 务 索 人 时 ， 通 过 对 人 力 资源 模块 的 监 
控 ， 发 现 系统 没有 明显 的 CPU、 磁盘 、 内 存 或 网 络 瓶 颈 ， 但 是 事务 的 啊 应 时 间 比 平时 要 长 很 多 ， 
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平时 不 到 1s 就 能 处 理 了 ， 但 是 忙 时 可 以 达到 3s 以 上 ， 这 个 正 是 “懒惰 系统 ”的 症状 。 
这 种 现象 通常 是 和 锁 有 关 , 而 且 通 常 是 死 锁 , 从 db2diag.log 里 面 发 现 了 900 多 次 死 锁 事件 。 


Aa 小 技巧 ， 使 用 DB2 自 带 的 死 器 
为 了 方便 DBA 或 者 开发 人 员 更 好 地 检测 和 处 理 死 锁 ，DB2 提供 了 一 个 默认 的 死 锁 
检测 器 db2detaildeadlock， 只 要 执行 “db2evmon -db erpdb -evm db2detaildeadlock” 命 令 ， 
随后 根据 输出 就 可 以 方便 地 分 析 和 定位 死 锁 了 。 


下 面 db2evmon 命令 生成 的 片段 , 发 现 和 VM CODE 这 个 表 有 关 , 其 中 死 锁 是 由 于 “UPDATE 
HR.VM CODE SET MARKET CODE ?, BATCH NO = ?, SERIAL NO =? WHERE CODE ID=?” 
这 个 update 语句 导致 的 。 


db2evmon -db casms -evm db2detaildeadlock 


4067) Deadlock Event 
Deadlock ID: T323 
Number of applications deadlocked: 2 
Deacdilock el eS on cimes 2012-11-10 15:57:54, 247477 
Rolled back Appl participant no: 2 
ROLled back Appl Id: 10.5.1.119. 8968.121109204404 
Rolled back Appl seq number: : 1b74 


4068) Deadlocked Connection 
Deadlock ID: 13523 
Participant no.s 2 
Participant no., holding tche locks 1 
APPL Id: 10.5.1.19.8968.121109204404 
Appl Seq number: 07028 
Appl Id of connection holding the Locks 10.5.1,.19,61192,.121109232601 
Seq. no. of connection holding the lock: 00014 
LOGk wait start times 2012-=11=10 15:573:45,184779 


Lock Name : 0x04000F001100EB588400000052 

Lock Attributes : 0x00000000 

Release Flags : 0x40000001 

LOCk Count DE 

Hold Count 3 0 

Current Mode : NS - Share (and Next Key Share) 
DERECE el ee en omnes 
Table of lock waited on : VM CODE 

Schema of lock waited on 2 HR 

Darta particion id for table 3 0 


Tabrecpa e Of ore woreeo on Ir IDE 

Type of lock: Row 

Mode of lock: NS - Share (and Next Key Share) 

Mode application requested on lock: X - Exclusive 
Node lock occured on: O0 

Lock object name: 568427479057 

Application Handles 508 
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Deadlocked Statement: 


Type Jc Dynamic 

Operation: Execute 

Section 3 3 

Creator 3 NULLID 

Package : SYSSN300 

Cursor 2 SOL CURSN300C3 

Cursor was blocking FALSE 

TEXT : UPDATE HR. VM CODE SET MARKET CODE = ?, BATCH NO = ?, SERIAL_NO =? WHERE 


CODE ID - ? 
LISE OE LOCKSS 


Lock Name 3 0x04000F001100EB5€68400000052 
Lock Attributes 2 0x00000000 
Release Flags : 0x40000001 
LOCK Count zi 
Hold Count :0 
Lock Object Name 8 560427479057 
Object Type : Row 
Tablespace Name 3 HR DTS 
Table Schema 2 HIR 
rable Name JESUM PIDE 
Darta particion ial 3 O 
Mode 3 => ExClusiye 
StTacus : Converting 
Current Mode : NS - Share (and Next Key Share) 
Lock Name : 0x04000F00000000000000000054 
Lock Attributes 2 0x00000000 
Release Flags : 0x40000001 
Dock Count ur 
Hole Count 
Lock Object Name UM 
Object Type : Table 
TabTespace Name 3 HR DTS 
Table Schema 3 HIR 
rable Name EVE OIDE 
Darta particion iad S 0 
Mode : IX - Intent Exclusive 
Locks Held: 20 


bocks in Lists 20 
Locks Displayed: 20 


4069) Deadlocked Connection 
Deadlock ID: T323 
Participant no.s 1 
Participant no., holding tche Locks 2 
Appl Icd: 10.5.1,.19.61192.121109232601 
Appl Seq number: 05342 
Appl Ird of connection nolding the locks 10.5.1.19.8968.121109204404 
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Seē@. no., OË connection holding the lock: 00001 
LOEk wait start times 2012=11=10 15:57:45. 127741 


Lock Name : 0x04000F001100EB588400000052 

Lock Attributes : 0x00000000 

Release Flags : 0x40000060 

LOCK COUNE DA 

Hole Count 

Current Mode : NS - Share (and Next Key Share) 
Deadlock detection time: 2012-11-10 15:37:54.248866 
Pable 99s Jos. welt «cl 2 VM CODE 

Schema of lock waited on 2 HR 

Data partition icd for table 3 (0 


Ico eese or Foc Lee Cor R DTS 

Type of lock: Row 

Mode of lock: NS - Share (and Next Key Share) 

Mode application requested on lock: X = BxCluüusive 
Node lock occured on: 0 

Lock object name: 568427479057 

Application Handles 314 

Deadlocked Statement: 


Type > Dynamic 

Operation: Execute 

Section : 4 

Creator 3 NULLID 

Package : SYSSN300 

Cursor OO CURSN O00 

Cursor was blockings FALSE 

TEXT 3 UPDATE HR YM CODE SET MARKET CODE = ?;, BATCH NO = Eie SERIAL NO=? WHERE 


CODRII DE 
LISE OE LOCKSS 


Lock Name : 0x04000F000500EB588400000052 


Lock Attributes : 0x00000000 

Release Flags : 0x00000020 

LOCK Count E 

Hole Count 3 0 

Lock Object Name 2 560427479045 

Object Type : Row 

Tablespace Name 3 HR DTS 

Table Schema 3 HIR 

Table Name UEM O ODIDIE 

Data partition id 3 0 

Mode : NS - Share (and Next Key Share) 
Locks Held: 20 


hoc in Lists 20 
Locks Displayed: 20 


当 第 一 次 发 现 这 个 问题 时 ， 第 一 个 建议 是 让 DBA 去 检查 应 用 服务 器 Websphere 应 用 服务 
器 中 的 JDBC 数据 源 的 隔离 级 别 ， 从 读 稳 定性 CRS) 调整 为 游标 稳定 性 (CS) ， 本 来 以 为 调整 
后 可 以 解决 这 个 问题 ， 但 是 最 终结 束 是 没有 太 大 作用 。 
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人 A、 NE | pgp, 00 14 
Aa 注意 : Websphere 6.0 应 用 服务 器 连 


aee 


Websphere 应 用 服务 器 6.0 或 者 以 下 版 本 ， 连 接 DB2 数据 库 时 ， 默 认 的 隔离 级 别 是 
读 稳定 性 。 在 很 多 应 用 中 ， 读 稳定 性 过 于 严格 了 ， 为 了 提高 并 发 性 ， 建 议 将 其 调整 为 游 
标 稳定 性 。 


在 解决 锁 问 题 的 时 候 ， 如 果 能 有 开发 人 员 和 DBA 的 文 持 和 配合 ， 将 会 有 助 于 更 快 地 解决 
问题 。 在 他 们 的 配合 下 ， 使 用 下 和 面 的 步 又 最 终 解 决 了 这 个 问题 。 
(1) 查看 VM CODE 表 的 DDL 定义 
可 以 看 出 这 个 表 的 字段 很 少 ， 主 键 也 很 简单 ， 只 有 一 个 字段 CODE ID 作为 主键 。 
CREASE "VMARKEBT MEAT CODE” ( 
“CODE ID” DECIMAL(1S,0) NOT NULL ， 
“MARKET CODE” VARCHAR (32) NOT NULL ; 
"BATCH NOY DECIMAL (7:0) NOT NULG ; 
"SERIAL NO" DECIMAL(7,0) NOT NULL) 
INDE 
==- DDL Statements tor Primary key Once pP 


ALTER TABLE "VMARKET "."VM CODE" 
ADD CONSTRAINT "P KEY 1" PRIMARY KEY 
("CODE ID"); 


(2) 了 解 应 用 逻辑 

在 人 力 资源 管理 模块 中 ， 每 一 个 事务 都 会 访问 这 个 表 VM_CODE， 首 先 根据 CODE ID £z 
询 出 当前 字段 的 值 ， 包 括 SERIAL NO. MARKET CODE 和 BATCH NO 字段 ， 其 中 最 重要 的 
是 SERIAL NO 字段 ; 用 完 后 ， 使 用 update 语句 修改 SERIAL. NO WEA IA. Xii A 
“ 先 查 再 改 ” 引 起 的 锁 问 题 ， 如 下 所 示 : 


ERE 
SELECT SERIAL NO MARKET CODE, BATCH NO FROM VM CODE WHERE CODE ID =? 


-- 如 果 遇 到 问题 ， 事 务 回 深 
UPDATE VM CODE SET MARKET CODE - ?, BATCH NO - ?, SERIAL NO - ? WHERE CODE ID - ? 


-- 提 交 事 务 
(35 分 析 表 中 数据 
但 是 奇怪 的 是 VM CODE 这 个 表 中 竟然 只 有 一 条 记录 ! ! ! WK 2-10 所 示 。 这 样 一 来 ， 


当 业 务 索 忙 时 ， 所 有 的 事务 都 在 争 抢 这 一 条 记录 ! 因此 业务 繁忙 时 事务 的 啊 应 时 间 就 急剧 增加 
Y, M HS REB YE! 


i 2-10 VM CODE 表 中 仅 有 一 条 记录 


CODE ID MARKET CODE BATCH NO SERIAL NO 


's0001' 50010001" 100002 


(4) 问题 解决 
如 下 所 示 ， 在 表 VM CODE 中 新 加 入 一 个 字段 HR ID， 这 个 字段 用 来 标示 人 力 资 源 部 门 
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员工 的 ID， 这 样 的 话 ， 每 个 员工 都 有 一 个 HR ID， 使 用 自己 的 SERIAL NO。 这 样 ， 当 业务 繁 
忙 时 ， 每 个 事务 不 会 争 抢 同 一 条 记录 。 


CREATE TABLE "VMARKET "."VM CODE" ( 
SCODE ETD DEC THAT 1E O NOT NULLI, 
"MARKET CODE" VARCHAR (32) NOT NULL , 
"BATCH NO" DECIMAL(7,0) NOT NULL , 
"SERIAL NO" DECIMAL(7,0) NOT NULL, 
"HR ID" VARCHAR(32) NOT NULL) 
IN "HR DTS" ; 


如 表 2-11 所 示 ， 增 加 一 个 字段 后 ， 表 VM CODE 中 每 一 行 记录 将 只 为 一 个 HR ID 所 有 ， 
在 进行 事务 处 理 时 , 每 个 HR ID 只 更 新 自己 所 属 的 SERIAL NO 字段 值 ， 这 样 就 避免 了 不 同 的 
事务 争 抢 同 一 条 记录 。 


表 2-11 重新 设计 后 的 VM_CODE 表 中 数据 


CODE ID HR ID 
sooor John 
s0002 William 
s0003" Mike 
ll | 


(5) 最 终 效 果 
如 表 2-12 所 示 , 调整 后 , 事务 啊 应 时 间 从 原来 的 3s 减少 为 1s 以 下 , 而 且 事 务 否 吐 量 从 300 
提高 为 1500， 性 能 得 到 了 极 大 提升 。 


表 2-12 调整 前 后 对 比 〈 忙 时 ) 
项 目 事务 吞吐 量 (单位 ， 每 秒 事 务 量 ) 
nai 300 
mns i500 


2.5.3 ”查询 分 析 模 块 优化 


在 2.4.1 节 我 们 讲 过 ， 这 个 模块 的 优化 需求 是 一 些 动态 伍 询 语句 要 在 2 分 钟 以 内 出 结果 ， 
那么 怎么 更 有 效 地 找到 这 些 语句 呢 ? 这 可 以 从 最 耗 时 或 者 执行 最 频 索 的 SQL 语句 入 手 。 

一 个 数据 库 运 行 的 合 询 语句 非常 多 , 重点 是 分 析 执 行 时 间 最 长 的 前 N 条 语句 ,例如 前 十 位 
的 查询 语句 。 这 可 以 从 管理 视图 “sysibmadm.snapdyn sql” 中 获取 ， 其 中 最 耗 时 间 的 查询 语句 
如 下 所 示 ， 总 的 执行 时 间 花 费 了 7386134 秒 ， 执 行 次 数 达到 了 4072390 次 ! 


select TOTAL BXEC TIME, NUM EXECUTIONS, STMT TEXT trom sysibmacm.snapelyn sgl order 
by TOTAL EXEC TIME dese fetch first 10 rows only 
NOMEE SER GTI COINS TOTAL EXEC TIME STMT TEXT 


RE ARE 4072390 7386134 
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SELECT FLIGHTDETAILIDENTIFIER, FLIGHTIDENTIFIER, flightDepartureTime FROM 
QRY.FLIGHTDETAILWHERE flightNumber-? ANDflightDepartureTime»? ANDflightDepartureTime 
<= ? ORDER BY flightDepartureTime DESC FOR READ ONLY 


那么 怎么 来 优化 这 条 查询 语句 呢 ? 通常 的 办 法 是 使 用 visual Explain 或 者 db2exfmt 22) 
这 些 SOL 语句 ; 随后 使 用 Design Advisor 工具 给 出 优化 建议 。 关 于 这 方面 的 细节 ， 读 者 可 以 参 
考 本 书 第 8 章 的 相关 内 容 。 

下 向 我 们 谈 一 下 其 体 的 步骤 : 

CIO 使 用 下 面 的 命令 生成 访问 计划 《〈 关 于 如 何 生成 访问 计划 ， 请 阅读 第 9 章 ) 。 


lerpinstliePrimaryNode=2 ~]$ cdo2 Yexplain plan with snapshot tor SELECT 
FLIGHTDETAILIDENTIFIER, FLIGHTIDENTIFIER, flightDepartureTime FROMQRY.FLIGHTDETAILWHERE 
flightNumber = ? AND flightDepartureTime > ? AND flightDepartureTime «- ? ORDER BY 
flightDepartureTime DESC FOR READ ONLY" 

DB200001 SOL ít JJ. 


(2) 使 用 db2exfmt 格式 化 输出 ， 并 将 输出 重 定 问 到 文件 queryplan.txt 中 。 


[eriinst1iCBrimaryNode2 mde mcm =o erpdo =1 =o gueryplan txt 
DB2 Universal Database Version 9.7, 5622=044 (e) Copyright IBM Corp. 1991, 2009 
Licensed Material - Program Property of IBM 


IBM DATABASE 2 Explain Table Format Tool 


Connecting to the Database. 
Connect to Database Successful. 
Output is in queryplan. Txt. 


Executing Connect Reset -- Connect Reset was Successful. 


(3) 查看 queryplan.txt 文件 中 的 访问 计划 。 如 下 所 示 ， 可 以 看 到 这 个 查询 需要 排序 和 表 扫 
描 ， 执 行 代价 比较 局 ， 达 到 了 597.793. 


[erpinst1@0PrimaryNode-2 ~|s more queryplan.txt 


Access Plan: 
Total Cost: 598.793 


Query Degree: Hi 


ROWS 
RETURN 
EID 
COST 
T/O 
| 
©- 00923729 
TBSCAN 
(2) 
598-793 
1719:1608 
| 
0 -00923729 
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SORT 
[n 
998- 793 
79-1608 
| 
-00925729 
FETCH 
(d) 
598-7193 
79-1606 
ym D 
129,598 ZS 
IXSCAN TABLE: QRY 
( 5)  FLIGHTDETAIL 
ILS Ib Q1 
2 
| 
2.71776e-006 
INDEX: QRY 
X5ACPR37 32 
Q1 


C» 


(4) 要 想 消 除 排序 和 表 扫 描 ， 建 立 合 适 的 索引 可 以 解决 这 个 问题 。 考 虑 到 得 询 的 谓词 ， 
建立 下 面 的 复合 索引 ， 包 括 字 段 FLIGHTNUMBER fI FLIGHTDEPARTURETIME. 
CREATE INDEX "QRY GAGEBRS7 32% ONORS W a YTD TGEBOLUDEILA ILL W 
("FLIGHTNUMBER" ASC, 
"FLIGHTDEPARTURETIME" ASC) 


MINPCTUSED 10 
ALLOW REVERSE SCANS; 


创建 完毕 后 ， 运 行 runstats ME, EMMER EE, KEARE EY H VE R KHR 
就 可 以 用 上 索引 了 。 
|lerpuinstlaPrimaryNode-2 ~] $ dobo2 runstats on table ORY. FLIGHTDETAIL with distribution 


on all columns anc indexes all 
DB20000I RUNSTATS 命令 成 功 完成 。 


C50 对 比 访 问 计 划 。 


在 真正 执行 之 前 , 下 面 是 新 生成 的 访问 计划 , 可 以 看 到 新 建立 的 索引 已 经 被 优化 器 用 上 了 ， 
索引 扫描 代替 了 表 扫 描 和 排序 ， 执 行 成 本 也 相应 减少 到 了 15.2025! 


Access Plan: 
Total Cost: 15.2025 


Query Degree: 1 


Rows 
RETURN 
( 1) 

Cost 

I/O 
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| 
0- 00865317 
FETCH 
(o — 2j 
15.2025 
2.00878 
OO se 
0.00878028 2.52048e+006 
IXSCAN TABLE: QRY 
(39 FLIGHTDETAIL 
Ms be se Q1 
2 
| 
2.52048e-006 
INDEX: QRY 
X6ACPR37 32 
Q1 


再 对 比 一 下 优化 前 后 的 查询 时 间 对 比 ， 如 表 2-13 所 示 ， 从 原来 的 1 分 钟 减少 到 了 10 Eb, 
大 幅 近 高 了 性 能 。 
表 2-13 优化 前 后 对 比 
查询 语句 执行 时 间 
优化 前 62 1 分 名 


优化 后 27177610 "T 


最 后 ,我 们 用 类 似 的 办 法 优化 了 其 他 查询 语句 ， 最终 使 得 所 有 的 查询 语句 都 在 2 分 钟 以 内 出 
结果 ， 这 满足 了 业务 对 查询 时 间 的 需要 。 
Aa 小 技巧 : 使 用 Design Advisor 工具 优化 
其 实 , 除 了 使 用 db2exfmt 分 析 查 询 计 划 , 随 后 手工 创建 索引 之 外 ,还 可 以 通过 Design 
Advisor 工具 来 实现 。 这 个 工具 提供 的 建议 可 以 和 专家 建议 相 媳 美 ,如果 存在 有 大 量 需 
优化 的 SQL 语句 ， 使 用 工具 可 以 显著 提高 效率 。 关 于 Design Advisor 的 使 用 ， 读 者 可 以 
参考 第 9 章 相 关内 容 。 


2.5.4 报表 应 用 优化 


在 报表 模块 里 面 ， 报 表 数 据 库 有 自己 单独 的 一 套 表 结构 ， 其 中 所 需要 的 数据 都 是 从 人 力 资 
源 数据 库 中 的 相关 表 中 抽取 过 来 的 ， 抽 取 方 式 采 取 日 增 量 抽取 的 方式 。 抽 取 和 加 载 所 人 允许 的 时 
间 窗 口 为 每 天 晚上 12 点 到 第 二 天 凌晨 8 点 ， 总共 为 9 个 小 时 。 在 上 线 初期 ， 完 成 每 天 的 所 有 数 
据 抽取 和 加 载 所 需要 的 时 间 只 有 5 个 小 时 ，9 个 小 时 的 时 间 窗 口 完 全 可 以 满足 需要 ， 过 了 几 个 
月 后 , 每 天 需要 10 个 小 时 才能 完成 抽取 和 加 载 , 现 有 的 9 个 小 时 的 时 间 窗 口 已 经 难以 满足 需要 
了 ， 需 要 进行 性 能 优化 。 

先 来 分 析 一 下 数据 抽取 和 加 载 的 存储 过 程 脚本 ， 例 如 下 面 是 一 个 增 量 抽取 的 脚本 ， 其 中 重 
要 的 语句 是 “INSERT INTO ... SELECT”， 用 来 抽取 HR.CHARGE 中 数据 ， 并 加 载 到 报表 数据 


72 


423 实战 业 例 研究 与 分 享 SE 


库 中 的 RPT.CHARGE REPORT 表 中 。 真 正 有 影 啊 性 能 的 关键 点 束 在 这 里 ， 因 为 使 用 “INSERT 
INTO ... SELECT” 语 句 ， 表 越 大 ， 那 么 需要 的 插入 时 间 束 越 多 ， 而 且 会 写 大 量 的 日 志 ， 对 日 志 
设备 造成 读 写 压力 。 


CREATE PROCEDURE RPT., SP DM QUANTITY (in MONTH OFFSET INTEGER) 


PIs BEGIN 


DECLARE sql code INTEGER; 

DECLARE sqlstring varchar(1000); aa 
Dealer ee me i000) 

DD oe ee 

De meme es 

DECLARE stepname varchar(1000); 

declare sqlcode integer default 0; 

DECLARE sqlstate char (5); 


-- 设 置 增 量 抽取 结束 时 间 
set end _cdate=(select date (rtrim(enar (year mac ))) II “=" |] 


prterim(cehar (month (current timesteamo ))) |I “=1")=1 day from sysibm.syscdummyl) 5 


-- 插 入 数据 
INSERT INTO RPT.CHARGE REPORT 
SELECT CHARGEIDENTIFIER,CASE WHEN SOURCEUOMI-'DISTANCE' 
THEN QUANTITYUOM1 
ELSE CASE WHEN SOURCEUOM2-'DISTANCE' 
THEN QUANTITYUOM2 
else 0 END 
END as DISTANCE FROM HR.CHARGE; 


commit; 

ON 

解决 这 个 问题 的 关键 点 是 找到 对 “INSERT INTO…SELECT” 语 名 的 奉 代 方案 ， 要 求 能 够 
加 载 大 量 数 据 ， 加 载 时 间 比 较 稳 定 ， 而 且 对 日 志 设 备 没 有 太 大 性 能 压力 ， 很 多 读者 可 能 会 想到 
使 用 LOAD 方式 来 做 , 但 是 使 用 和 常规 LOAD 方式 的 时 候 首 先 需 要 让 源 表 的 数据 落地 成 文件 , 随 
后 再 LOAD 到 目标 表 中 ， 需 要 占用 额外 的 空间 。 


比较 : LOAD 和 INSERT 数据 导入 速度 


LOAD 导入 与 INSERT 不 同 ， 它 并 不 是 通过 SQL 语句 的 INSERT 进行 导入 ， 而 是 把 导入 数 
据 以 数据 页 的 形式 直接 存 入 数据 库 中 。 这 就 意味 着 摆脱 了 SQL 语句 的 束缚 ,以 一 种 物理 方式 把 
数据 放 入 数据 库 中 ， 并 且 在 导入 过 程 中 不 记录 日 志 ， 特 别 适 合 大 数据 量 导 入 。 另外 ，LOAD 过 
程 中 会 使 用 并 行 性 ， 有 多 个 进程 或 者 线程 进行 处 理 ， 理 论 上 讲 速 度 会 明显 高 于 INSERT. 

我 们 在 这 台 x3850 机 器 上 做 过 试验 ， 对 于 一 个 有 7 千 万 条 记录 ， 大 小 为 50GB 的 表 进 行 
INSERT 大 约 用 了 6 个 小 时 ， 而 同样 的 数据 使 用 LOAD 导入 ， 只 用 了 1 个 小 时 左右 就 完成 了 。 
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下 面 介 绍 一 种 LOAD 的 高 级 用 法 ， 即 LOAD--FROM CURSOR 的 方式 ， 它 本 质 上 也 是 
LOAD， 但 是 中 间 不 需要 让 源 表 的 数据 洛 地 成 文件 ， 所 以 在 程序 中 使 用 更 为 方便 。 这 可 以 通过 
特殊 的 存储 过 程 ADMIN CMD 来 调用 , 从 而 把 LOAD…FROM CURSOR HKA EIF AKTIERI 
中 。 如 下 所 示 ， 使 用 LOAD…FROM CURSOR (RË J “INSERT INTO…SELECT” 语 人 句 。 


CREATE PROCEDURE EI SP DM QUANTITY (in MONTH OFFSET INTEGER) 
PI? BEGIN 


DECIME E OO el ee ees; 

DECLARE oL e n a aeaa O a 5081 
DECIME en a OOO 

DECLARE begin date cate, 

De deret rogue Ole 

DECLARE stepname varchar(1000); 

declare sqlcode integer default 0; 

DECLARE sqlstate char (5); 


-- 设 置 增 量 抽取 结束 时 间 
set end _cdatce= (select date (rtrim(ecenar uu ein date ))) | | “=" |] 


puc meh (month (current timestamo ))) |1| “=1")=1 day from sss Ine sis c mmy 


-- 插 入 数据 
call sysproc.admin cmd('load from(SELECT INVOICEDETAILIDENTIFIER,O, 
SUM (CASE WHEN SOURCEUOMI-''DISTANCE'' 

THEN QUANTITYUOM1 
ELSE CASE WHEN SOURCEUOM2-''DISTANCE'' 

THEN QUANTITYUOM2 

else 0 END 
END) FROM HR.CHARGE 
GROUP BY INVOICEDETAILIDENTIFIER,O) of cursor insert into RPT.CHARGE REPORT 

nonrecoverable '); 


commit; 


END $ 


如 表 2-14 所 示 ， 对 同样 一 个 具有 43 个 字段 、850 多 万 条 记录 的 表 ， 改 变 加 载 方 式 后 ， 性 
能 提高 了 1$0% 。 在 具体 实施 中 ,也 用 到 了 LOAD…FROM CURSOR 同时 并 行 抽 取 加 载 多 个 表 ， 
这 样 一 来 , 就 可 以 最 大 限度 地 利用 上 了 便 件 资源 ， 所 需要 的 时 间 从 原来 的 每 天 10 AT, x 
为 4 个 小 时 就 可 以 完成 了 。 


zx 2-14 两 种 抽取 和 加 载 时 间 对 比 
测试 项 目 加 载 时 间 
INSERT INTO---SELECT 8638200 43 


LOAD:…FROM CURSOR 8638200 8 分 钟 


2.5.5 ”性 能 优化 总 结 
最 终 ， 我 们 完成 了 这 个 DB2 经 营 分 析 库 的 优化 工作 ， 所 采用 的 方法 如 表 2-15 所 示 。 性 能 
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TUER ZH]. MERRE EREMI, dHIBINIOONUMNCU ZuNS HBüxedkochhTk, KIRJA II 
使 件 和 应 用 情况 对 镍 下 药 ， 丈 活 处 理 。 


表 2-15 优化 方法 总 结 
数据 库 和 应 用 优化 方法 
全 局 调整 和 优化 不 能 一 构 而 论 ， 不 同 的 系统 有 不 同 的 全 局 调整 办 法 ,但 重点 和 难点 在 于 做 好 
存储 规划 和 内 人 存 参数 调整 ， 同 时 能 够 根据 冷 热 程度 灵活 处 理 热 表 和 大 表 
人 力 资源 管理 针对 “懒惰 系统 ”， 重 点 是 解决 锁 争 抢 问 题 。 这 种 问题 通 芝 是 由 于 应 用 的 诛 
因 导 致 的 ， 例 如 应 用 中 的 多 个 事务 先 碍 询 再 修改 一 张 热 表 ， 这 样 容 易 友 生 
多 个 事务 同时 第 抢 同一 条 记录 。 优 化 方法 是 重新 对 表 进 行 了 设计 ， 也 修改 了 


事务 执行 的 逻辑 代码 

查询 分 析 抓 住 重点 ， 集 中 精力 优化 最 耗 时 和 执行 最 频 索 的 前 信条 SQL 语句 ， 这 样 可 以 
以 最 少 的 投入 换 来 最 大 的 性 能 提升 

报表 报表 中 的 数据 通 弟 来 自 于 业务 系统 ， 使 用 LOAD…FROM CURSOR RË T 


“INSERT INTO…SELECT” 语 句 ， 这 样 既 可 以 抽取 加 载 大 量 数 据 ， 也 不 用 写 
日 志 ， 不 会 对 日 志 设 备 读 写 造 成 很 大 压力 ， 从 而 提升 性 能 


2.6 hz 


本 章 以 某 汽车 制造 商 ERP 应 用 的 Oracle RAC 数据 库 系 统 为 例 , 提出 了 扩展 DB2 经 营 分 析 
库 来 对 Oracle RAC 进行 “瘦身 ”的 方案 ,随后 给 出 实施 步 又， 并 在 此 基础 上 提出 了 DB2 HADR 
方案 来 解决 灾 备 问题 。 

上 线 运 行 一 段 时 间 出 现 性 能 问题 后 ， 又 重点 讲解 了 如 何 对 其 进行 性 能 优化 : 即 通过 业务 分 
析 来 确认 性 能 问题 ， 通 过 系统 分 析 来 确定 性 能 原因 ， 随 后 制定 优化 计划 并 成 功 实施 。 和 希望 大 家 
学 习 完 这 个 案例 后 可 以 举一反三 ， 真 正 指导 自己 的 优化 实践 。 
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老 赵 是 一 家 电信 公司 的 DBA， 曾 经 维护 过 Oracle. Sybase. Mysql 等 多 种 数据 库 系统 ， 
今年 开始 建设 基于 DB2 的 客户 关系 管理 系统 ( CRM ) ， 从 而 正式 接触 DB2 了 。 前 几 天 ， 他 给 
我 打 来 电话 ，“ 我 的 DB2 数据 库 系 统 比 蜗牛 扑 得 都 慢 ， 帮 帮 了 我 吧 ! ”于 是 ， 我 对 老 赵 所 在 电信 
公司 的 DB2 数据 库 进 行 了 健康 检查 ,从 中 发 现 了 一 系列 问题 。 我 和 老 赵 进 行 了 深入 的 技术 交流 ， 
发 现 这 些 问 题 的 最 终 根 源 在 于 系统 建设 初期 不 良 的 物理 设计 。 

笔者 前 面 批 判 过 国内 很 多 企业 软 硬 件 选 型 中 的 一 个 弊病 ， 那 就 是 育 目 地 选择 高 档 和 硬件。 但 
这 个 电信 公司 是 另外 一 个 极端 ， 也 太 抠 门 了 ， 所 选择 的 8 内 核 的 x3650 服务 器 已 经 落后 多 年 ， 
无 法 满足 CRM 系统 对 响应 时 间 和 事务 吞吐 量 的 要 求 。 

除了 硬件 的 抠门 外 ， 该 电信 公司 在 物理 设 
计 中 也 存在 很 多 不 合理 的 地 方 ， 例 如 没有 一 套 
针对 热 数 据 和 大 数据 的 存储 和 访问 策略 ， 没 有 
选择 合理 的 RAID 级 别 ， 表 空间 和 缓冲 池 的 规 国 


划 也 不 符合 最 佳 实 践 。 

用 一 句 话 概 括 , 这 是 一 个 匆忙 上 马 的 项 目 ， 
没有 进行 正规 的 硬件 选 型 ， 没 有 进行 合理 的 物 
J 

最 终 ， 在 我 们 的 建议 下 ， 这 个 电信 公司 重 
新 进行 了 硬件 选 型 ， 并 基于 新 硬件 重新 进行 了 
物理 设计 。 本 章 将 以 这 个 电信 公司 为 例 ， 详 细 
阐述 硬件 选 型 原则 和 物理 设计 技巧 。 
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3.1 ”从 数据 库 硬件 选 型 谈 起 


在 数据 库 系 统 建 设 初期 ， 系 统 染 构 师 需要 根据 当前 的 业务 情况 、 对 未 来 发 展 的 规划 以 及 建 
设 经 费 等 情况 进行 评 佑 ， 这 样 可 以 为 系统 选 型 做 好 准备 。 以 老 赵 所 在 的 电信 公司 便 件 重新 选 型 
为 例 ， 他 们 在 DB2 数据 库 服务 器 的 选 型 上 ， 纤 合 芳 夸 了 数据 处 理 能 力 、 可 菲 性 和 投资 成 本 等 几 
个 方面 的 需求 ， 并 结合 公司 3-5 年 的 业务 发 展 预 期 ， 进 行 系统 评估 和 决策 。 

实际 上 上， 数据 库 价 件 选 型 需要 综合 考虑 多 种 因 系 ， 接 下 来 从 主机 、 和 存储 和 网 络 环境 三 个 方 
面具 体 曾 述 。 


3.1.1 对 主机 的 考虑 


经 过 第 1 革 的 学 习 ， 相 信 大 部 分 读者 已 经 了 解 到 一 个 业务 系统 最 重要 的 性 能 指标 是 啊 应 时 
间 ， 这 是 因为 对 最 终 用 户 来 说 ， 最 敏感 的 束 古 啊 应 时 间 。 所 以 ， 选 择 什么 样 的 主机 ， 束 古 从 啊 
应 时 间 这 个 角度 出 友 考 虑 的 。 


比较 : X86 服务 器 和 Power 服务 器 


在 选择 服务 器 的 时 候 , 很 多 客户 经 常 问 的 问题 就 是 ， 到 底 是 选择 X86 服务 器 还 是 Power JR 
务 器 ? 
其 实 ， 这 个 问题 要 根据 具体 需求 来 定 ， 不 能 一 概 而 论 ， 读 者 可 以 参考 下 面 的 原则 。 
e 关键 业务 系统 优先 选择 Power 服务 器 。 
e 从 性 价 比 考虑 可 以 选择 X86 服务 器 。 
e 由 于 预算 的 原因 ， 可 以 先 选择 X86 服务 器 作为 过 渡 ， 随 着 数据 量 和 用 户 量 的 变 大 ， 到 
了 一 定 阶段 再 迁移 到 Power 服务 器 上 。 


选择 主机 的 第 一 步 是 决定 CPU 的 内 核 个 数 ， 这 要 根据 OLTP 和 OLAP 不 同 的 应 用 类 型 分 
3 JH EL 25 E. 

针对 OLTP 系统 ， 可 以 基于 现 有 的 DB2 数据 库 系统 来 估算 新 系统 对 CPU 的 需求 。 例 如 : 
新 系统 要 处 理 比 原 系统 多 50% 的 用 户 请 求 , 而 SQL 语句 的 复杂 度 和 现 有 系统 相似 或 更 复杂 ， 则 
可 估算 出 新 系统 需要 增加 至 少 50% 左 右 CPU 的 处 理 能 

针对 OLAP 系统 ， 还 需要 考虑 应 用 系统 SQL 语句 的 复杂 程度 、SQL 查询 表 关 联 情 况 ， 聚 
集 计 算 等 也 都 在 考虑 之 内 。 

除了 CPU 外 ， 还 要 求 服 务 髓 配置 足够 多 的 内 存 ， 以 及 足够 带宽 的 存储 设备 ， 以 使 得 LO Jj 
面 没有 瓶 倾 ,实现 高 吞吐 量 。 根 据 经 验 , 对 于 内 存 , 推荐 1 个 Power 处 理 占 内 核 配备 8GB 内 存 ， 
一 个 X86 处 理 器 内 核 配备 AGB 内 存 ; 对 于 存储 ，1 个 Power 处 理 右 内 核 可 以 处 理 300-500GB 
活动 数据 ，1 个 X86 处 理 嚣 内核 可 以 处 理 200-300GB 活动 数据 。 


3.1.2. ”对 存储 的 考虑 


在 数据 库 系 统 中 ， 出 于 对 存储 可 靠 性 和 多 块 磁盘 VO 吞吐 能 力 更 强 的 考虑 ， 通 常 使 用 磁盘 
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阵列 设备 。 

选择 人 磁极 阵列 设备 时 ， 需 要 考虑 业务 的 性 能 指标 ， 主 要 包括 IOPS 和 TPS。IOPS 用 于 描述 
UO Fita, HEAK UO 访问 次 数 来 衡量 。TPS 用 于 描述 事务 吞吐 量 ， 用 每 秒 处 理 的 事务 
数 来 衡量 。 

为 了 满足 IOPS 和 TPS 这 两 个 性 能 指标 ， 需 要 选择 合理 的 RAID (Redundant Array of 
Independent Disks) 级 别 ， 并 按照 选 定 的 RAID 级 别 定 义 好 合理 的 物理 磁 舟 个 数 。 

可 以 使 用 条 带 化 技术 将 VO 负载 均衡 分 布 在 这 些 物理 磁盘 上 ， 也 就 是 说 将 一 次 逻辑 UO 请 
求 分 割 成 多 个 小 部 分 ， 每 个 小 部 分 同时 访问 存储 在 不 同 物理 磁盘 上 的 数据 ， 这 样 可 以 最 大 程度 
地 降低 磁盘 冲突 ， 提 升 IO 并 行 度 ， 从 而 提升 VO 性 能 。 

RAID 10 和 RAID 5 因 各 自 实现 的 技术 特点 ， 在 读 与 写 的 性 能 上 又 有 不 同 。 通 常 ，RAID 10 
适合 写 操作 ,而 RAID5 更 适合 读 操作 。 出 于 对 性 能 的 考量 , 推荐 将 数据 库 事务 日 志 部 署 在 RAID 
10 HAHAE. 

存储 的 性 能 指标 与 RAID 的 物理 人 磁盘 个 数 奶 是 相关 ， 那 么 选择 多 少 个 物理 人 磁盘 比较 合适 
WE? 根据 每 个 处 理 器 内 核 可 以 分 担 的 活动 数据 量 来 计算 需要 的 磁盘 个 数 。 

也 许 用 户 还 有 一 个 顾虑 ， 数 据 库 服务 器 与 存储 通讯 会 不 会 有 瓶颈 ? 鉴于 这 个 问题 ， 推 荐 采 
用 SAN 网 络 来 提升 通讯 效率 。 


3.1.3 ”对 网 络 环境 的 考虑 
网 络 环境 ， 包 括 数据 库 系统 内 部 使 用 的 网 络 环境 和 外 部 应 用 访问 数据 库 的 网 络 环境 。 
1. 数据 库 系统 内 部 使 用 的 网 络 环境 


该 环境 是 指 DPF 或 者 pureScale 等 数据 库 成 员 之 间 的 通讯 所 要 求 的 网 络 环境 。DPEF 多 分 区 
数据 库 的 各 个 分 区 拥有 上 自己 的 资源 ， 包 括 CU、 内存 、 人 磁极、 各 目的 数据 索引 配置 文件 和 事务 
日 志 ， 各 分 区 之 间 是 并 行 的 ， 因 此 各 分 区 之 间 的 数据 交互 ， 必 须 依赖 高 速 网 络 才 能 保证 民 好 的 
性 能 。 

对 于 DB2 pureScale 数据 库 而 言 , 它 的 特点 是 各 成 员 和 CF ZLIRIAZ HIE KH T RDMA dx 
术 ， 和 直接 读 或 写 男 一 台 计 算 机 的 内 存 ， 因 此 超 高 速 InfiniBand 网 络 的 使 用 是 pureScale ri E BER 
TRUE « 


2. 外 部 应 用 访问 数据 的 网 络 环境 


该 环境 是 指 中 间 件 或 者 应 用 与 数据 库 之 间 的 网 络 环境 。 例 如 第 见 的 IJBM 中 间 件 WAS (Web 
Application Server) 与 DB2 数据 库 之 间 。 如 果 使 用 独立 的 高 速 网 络 ， 将 会 大 幅 提 升 部 署 在 WAS 
上 的 应 用 系统 访问 数据 的 性 能 。 


3.1.4 电信 公司 选 型 结 采 


这 个 电信 公司 的 应 用 特点 是 以 OLTP 事务 型 为 主 ， 以 OLAP 分 析 型 为 辅 。 应 用 的 性 能 要 求 
是 ， 平 时 要 求 事务 吞吐 量 达到 300TPS， 每 个 事务 的 啊 应 时 间 要 求 在 3s 以 内 完成 ，IOPS 要 求 
200 ^; 忙 时 要 求 事务 吞吐 量 达到 1000TPS， 每 个 事务 的 响应 时 间 要 求 在 5s 以 内 完成 ，IOPS 
要 求 300 个 。 

针对 上 面 的 性 能 要 求 ， 首 先 对 主机 实现 “ 乌 枪 换 炮 ”， 放 弃 了 x3650 服务 器 ， 选 用 了 两 台 
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Power 740， 一 台 用 于 DB2 主机 ， 另 外 一 台 用 于 DB2 备 机 。 每 台 Power 740 都 有 8 个 内 核 ， 根 
据 1 个 CPU 内 核 使 用 8GB 内 存 的 原则 ， 上 所 以 内 存 配置 为 64GB。 根 据 1 个 CPU 内 核 分 担 
300-500GB 活动 的 原始 数据 ， 所 以 选择 了 拥有 32 块 磁盘 的 DS8300 存储 设备 ， 单 块 磁 盘 容 量 为 
300GB。 网 络 有 两 种 ， 一 种 是 外 部 网 络 ， 用 于 连接 数据 库 服 务 器 和 应 用 服务 器 ， 另 外 一 种 是 内 
部 网 络 ， 用 于 连接 DB2 主机 和 DB2 备 机 。 详 细 清 单 如 表 3-1 所 示 。 


表 3-1 硬件 选 型 结果 


主机 两 台 Power 740 
操作 系统 AIX 6100-06 
CPU 8 核 
内 存 64GB 
存储 DS8300， 总 共 24 块 物理 盘 ， 单 盘 容 量 为 300GB， 规 划 为 RAID 


10。 其 中 8 块 盘 划分 一 个 LUN 用 于 存放 日 志 ， 总 容量 为 8/2X 
300GB=1200GB; 12 块 盘 划分 一 个 LUN, 用 于 存放 数据 和 索引 ， 
总 容量 为 12/2 X300GB=1800GB; 将 剩余 4 块 盘 化 为 一 个 LUN 
用 于 存放 临时 数据 和 文件 ， 总 容量 为 42X300GB=600GB 


外 部 网 络 TE 
(数据 库 服务 器 和 应 用 服务 器 之 间 ) 
内 部 网 络 干粮 网 
(DB2 主机 和 DB2 备 机 之 间 ) 
完成 硬件 选 型 后 , 接 下 来 就 需 me 


要 规划 数据 库 服务 器 的 部 署 了 。 如 
图 3-1 所 示 ， 数 据 服务 器 、 网 络 、 
存储 和 应 用 服务 器 的 架构 图 。 其 
中 ， 为 了 实现 DB2 主机 和 DB2 备 
机 之 间 的 高 可 用 性 ,选择 了 AIX F "s 
台 上 的 HACMP PX «1E? T DU Ph, (Power 740) 
DB2 EPLF vi &b 388 Nvv Hl ls o5 8 H1] 
请 求 , 当主 机 出 现 故障 时 , HACMP 
协议 可 以 实现 备 机 对 主机 的 接管 ， 


DB2 备 机 
(Power 740) 


存储 
从 而 满足 业务 对 数据 库 不 则 汤 运 (DS8300) 


加 村 
行 的 需要 。 图 3-1 硬件 架构 图 


SJL > 
3.2 ”存储 设计 
本 文 对 主机 、 网 络 环境 不 再 袭 述 ， 着 重 谈 谈 存储 系统 的 设计 。 
数据 库 和 存储 系统 息息相关 。 如 果 为 数据 库 选 择 硬件 ， 第 一 要 考虑 的 就 是 存储 架构 。 你 会 
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发 现 ，DB2 所 使 用 的 存储 越 快 ， 则 UO 性 能 将 越 好 。 

存储 是 存放 数据 和 日 六 的 地 方 ， 因 此 存储 的 设计 显得 格外 重要 。 特 别 是 随 看 现代 服务 器 拉 
术 的 发 展 ， 人 磁盘 技术 的 发 展 远 远 沙 后 于 CPU 和 内 存 的 技术 发 展 ， 这 个 时 候 如 果 出 现 了 存储 设计 
不 合理 ， 那 么 由 此 导致 的 IO 瓶颈 往往 会 成 为 性 能 最 薄弱 的 地 方 。 


— 10 年 前 ， 我 还 在 北京 读 研究 生 ， 由 于 家 境 贫 寒 ， 想 赚 点 学 费 ， 所 以 利用 署 假 时 间 帮 一 
' ”家 电信 服务 商 建设 和 维护 数据 库 。 刚 上 线 的 时 候 ， 数 据 库 运行 正常 ， 但 是 随 着 数据 量 
; ”和 用 户 量 的 快速 增长 ， 系 统 性 能 问题 开始 出 现 ， 而 且 也 频频 出 现 故障 。 我 那 时 白天 非 
; 常 繁忙 ， 到 了 晚上 过 的 也 很 充实 ， 因 为 做 梦 都 是 性 能 调 优 和 故障 诊断 ， 

但是， 有 一 天 发 生 的 事 让 我 着 愧 不 堪 。 那天， 这 家 电信 服务 商 的 CEO 带 着 风险 投资 人 
i 从 上 海 来 到 北京 ， 开 始 用 微软 公司 的 PowerPoint 软件 讲述 着 公司 的 美好 未 来 ， 这 时 风 
(00 险 投资 人 主动 提出 希望 看 看 这 个 系统 ， 于 是 CEO 点 击 一 个 页 面 又 一 个 页 面 进行 演示 。 
当 他 点 击 到 一 个 关键 页 面 的 时 候 ， 突 然 系统 就 没有 任何 反应 了 ， 摘 的 大 家 非常 雹 炊 ， 

: 估计 风险 投资 人 也 没有 兴趣 了 。 会 后 ， 这 个 CEO 感觉 和 了 大 面子 ， 于 是 他 把 网 页 设计 
(0 人员 找 来 ， 大声 痛 可 一 番 。 

; ”事后 我 才 知 道 ， 那 是 存储 设计 不 当 引 起 的 数据 库 性 能 不 佳 导致 的 ， 与 网 页 设计 人 员 没 
;有 半点 关系 。 从 此 以 后 ， 我 痛定思痛 ， 告 诉 自己 一 定 要 搞 好 性 能 优化 工作 ， 不 然 让 他 
”人 轻 则 被 多， 重 则 失去 重大 投资 机 会 啊 。 


3.2.1 磁盘 与 磁盘 阵列 技术 


人 磁盘 处 于 整个 存储 系统 的 最 抵 屋 ， 核 心 的 业务 数据 通常 都 存放 在 人 磁盘 上 。 由 于 任何 计算 都 
在 主 存 或 高 速 绥 存 中 进行 ， 因 此 对 于 数据 库 系 统 ， 最 关心 的 问题 是 如 何 快速 在 酸 盘 和 内 存 之 间 
移动 数据 ， 换 句 话 说 ， 台 是 如 何 实现 磁盘 阵列 的 高 效 读 写 。 
那么 如 何 衡量 一 个 磁盘 的 谈 写 能 力 呢 ? 有 下 面 一 些 指标 : 
e Riu (Rotational Speed) : 决定 磁盘 内 部 传输 率 的 关键 因素 之 一 , Ed rug 5400 
转 /分 钟 、7200 转 / 分 钟 和 15000 转 / 分 钟 ， 现 在 主流 的 都 是 15000 转 / 分 钟 。 理 论 上 ， 转 
速 越 快 越 好 ， 但 是 转速 越 快 友 热量 束 越 大 。 
e 平均 寻 道 时 间 CAverage Seek Time) : 即 似 检 管理 器 将 人 磁头 定位 到 合适 的 柱 面 所 花费 
的 时 间 ， 它 描述 磁盘 谈 取 数据 的 能 力 ， 单 位 为 寞 秒 。 
e 平均 延迟 时 间 (Average Latency Time) : 当 人 磁头 移动 到 数据 所 在 的 磁道 后 ， 然 后 等 
所 要 的 数据 块 继 续 转 动 到 磁头 下 所 用 的 时 间 。 
e 平均 访问 时 间 CAverage Access Time) : 即 人 磁头 找到 指定 数据 的 平均 时 间 ， 通 常 是 平 
均 寻 道 时间 和 平均 延迟 时 间 之 和 。 
VN AS 
对 于 读者 来 说 ， 如 果 读 取 的 数据 都 能 在 缓存 中 命中 的 话 ， 将 大 大 减少 磁盘 导 道 所 需 
要 的 时 间 。 对 于 写 来 说 ， 一 般 存 储 阵 列 只 要 求 数据 写 到 缓存 就 算 完成 了 写 操 作 ， 当 写 入 
的 数据 积累 到 一 定 程度 ， 存 储 阵 列 才 会 把 数据 刷新 到 磁盘 ， 这 样 可 以 实现 批量 写 入 。 所 
以 ， 缓 存 大 小 对 存储 读 写 性 能 影响 很 大 . 


L 一 一 = 一 


ap 


80 


$353 高 质量 物理 设计 m 


通常 上 述 指标 是 由 磁盘 本 喘 决 定 的 ， 有 时 候 ， 单 块 磁盘 的 IO 能 力 无 法 满足 应 用 的 性 能 需 
要 。 所 以 ， 可 以 考虑 将 多 个 相对 比较 廉价 的 人 磁盘 组 合 起 来 ， 并 相互 连接 ， 以 组 成 一 个 人 磁极 组 ， 
从 而 使 其 性 能 和 容量 达到 或 超过 一 个 价格 更 郧 贯 的 单个 大 型 磁盘 。RAID 正 是 基于 多 块 廉 价 做 
内 组 合 而 出 现 的 ， 它 推出 了 一 系列 的 级 别 ， 包 括 RAID 0. RAID 1. RAID 5, RAID 10 每， 如 
图 3-2 所 示 ， 由 5 块 磁 禹 组 成 的 磁盘 阵列 以 及 相应 的 RAID 0、RAID 1 Ñ RAID 5 级 别 。 


Disk Array Controller 
SCSI 


SCSI 


iti Disks 
H RAIDO Blocks 0 & 1 Blocks 2 & 3 Blocks 4 & 5 Blocks 6 & 7 Blocks 8 & 9 

| mee Blocks 10 & 11 Blocks 12 & 13 Blocks 14 & 15 Blocks 16 & 17 Blocks 18 & 19 
E Blocks 0& 1 Segment 1 Blocks 2 & 3 Segment 2 

Bü L-Blocks4 & 5 Segment 3 Blocks 6 & 7 Segment 4 

: RAIDS Blocks 0 &1 Blocks 2 & 3 Blocks 4 & 5 Blocks 6 & 7 

: Blocks 8 & 9 Blocks 10 & 11 Blocks 12 & 13 Blocks 14 & 15 

人 ,us (Blocks 16 & 17 Blocks 18 & 19 Blocks 20 & 21 Blocks 22 & 23 


图 3-2 ”磁盘 阵列 示意 图 


1. RAID 0 


RAID 0 方案 中 ， 采 用 条 融化 ， 把 数据 分 割 成 多 个 数据 块 ， 分 别 写 入 不 同 的 物理 磁盘 ， 在 多 
个 磁盘 上 均衡 了 UO 负载 ， 提 升 了 VO 并 行 度 ， 从 而 提升 了 效率 。 需 要 注意 的 是 ， 该 方案 牺牲 
了 了 可靠 性 ， 达 到 了 UO 的 最 局 性 能 。 

RAID 0 的 特性 : 磁盘 的 有 效 空 间 利 用 率 为 100%， 但 不 具有 数据 保护 功能 ， 不 适合 于 关键 
数据 。 在 实践 工作 中 ， 实 施 RAID 0 最 少 需 要 两 块 价 盘 理论 上 一 上 块 盘 也 可 以 创建 RAID OD 。 

2. RAID 1 


RAID 1 MARA ER TRI — 03 23S DIE XE PAL AP IL RE DATAE E BARI 3-2 
为 例 ，1 号 磁盘 和 2 号 磁盘 互 为 镜像 ，3 号 磁盘 和 A s E HN SER e 

RAID 1 的 特性 : 通过 磁盘 镜像 ， 将 同样 的 数据 复制 存储 到 不 同 的 磁盘 上 ， 从 而 提高 了 数据 
的 蜗 可 徘 性 。 读 写 操 作 效 率 较 高 ， 但 是 实施 成 本 融 。 

3. RAID 5 级 


RAID 5 在 所 有 的 磁盘 上 分 布 校 验 块 用 于 保持 数据 的 完整 性 , 并 在 磁盘 出 现 故 隐 时 进行 重建 。 
如 果 阵 列 内 的 东 个 磁盘 出 现 故 障 ， 丢 失 的 数据 可 以 根据 其 他 磁盘 上 的 校 验 块 进 行 重 建 。 这 种 分 
布 有 两 个 优点 : 首先 ， 几 个 写 操作 可 以 并 行 处 理 ， 因 为 消除 了 单一 校 验 盘 的 瓶 宽 ;第 二 ， 读 请 
求 有 很 局 的 并 行 度 。 因 为 数据 分 布 于 所 有 的 人 磁盘， 读 请 求 可 以 操作 所有 的 人 磁盘， 而 在 单一 校 验 
盘 的 系统 中 ， 校 验 盘 从 不 参加 读 操 作 。 

RAID 5 的 特性 : 更 有 效 地 利用 所 有 宛 余 RAD 配置 的 磁盘 容量 ， 保 持 了 良好 的 读 写 性 能 。 
人 不过， 磁盘 故障 会 影响 看 叶 速 率 ， 故 障 后 重建 信息 的 时 间 比 镜像 配置 情况 下 要 长 。 对 于 各 关 读 
操作 和 大 的 写 操作 ，RAID 5 与 其 他 市 有 见 余 的 RAID 系统 相 比 具有 最 好 的 性 能 ; 而 对 于 小 的 与 
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操作 ， 它 没有 RAID 1 的 性 能 好 。 


比较 : RAID 6 和 RAID 5 有 什么 区 别 


RAID 6 是 在 RAID SS 基础 上 ， 为 了 进一步 加 强 数据 保护 而 设计 的 一 种 RAID 方式 ， 实 际 上 
是 一 种 RAID 5 扩展 。 与 RAID 5 的 不 同 之 处 在 于 除了 每 个 硬盘 上 都 有 同 级 数据 的 校 验 区 外 ,还 
有 一 个 针对 每 个 数据 块 的 校 验 区 。 这 样 一 来 ， 等 于 有 了 两 个 校 验 保护 屏障 ， 因 此 RAID 6 的 安 
全 性 更 好 。 但 是 ， 由 于 增加 了 一 个 额外 的 校 验 ， 所 以 读 写 性 能 较 RAID 5 差 一 点 ， 另 外 也 减少 
了 有 效 存 储 空 间 。 


4. RAID 10 级 


RAID 10, 分 为 raid 1+0 MI raid 0+1 两 种 类 型 , 它 综合 了 条 市 (Striping) 和 镜像 CMirroring) 
技术 。RAID 1+0 首先 创建 2 个 独立 的 Raid 1， 然后 将 这 两 个 独立 的 Raid 1 组 成 一 个 Raid 0， 数 
据 被 有 序 的 写 入 两 个 Raid 1 中 ; RAID 0+1 是 先 做 RAID 0 Zi, BH RAID 1 镜像 ， 这 样 写 
入 速度 快 ， 读 的 速度 和 RAID 140 一 样 。 

RAID 10 的 特性 : RAID 10 是 RAID 1 和 RAID 0 的 结合 ， 它 的 优点 是 同时 拥有 RAID 0 的 
超 几 速度 和 RAID 1 的 数据 高 可 靠 性 。 此 配置 要 求 至 少 4 块 便 盘 ， 在 所 有 RAID 等 级 中 ， 人 性 能 
和 保护 功能 都 是 最 佳 的 。 

第 用 RAID 级 别 特点 总 结 见 表 3-2. 读 写 性 能 是 以 各 RAID 级 别 比 较 得 出 的 结论 ; 需要 的 夏 
盘 个 数 是 技术 上 可 以 支持 的 个 数 ， 例 如 RAID 0 可 以 只 使 用 一 块 磁 盘 ， 但 是 并 不 具有 实际 意义 。 


表 3-2 RAID 级 别 总 结 


RAID 级 别 RAID 0 RAID 1 RAID 10 RAID 5 


布 奇 倘 位 条 市 


un 
IN 
AR 
a 
X 
58 
X 
58 
HE 
a 
R 
a 
NT 


容错 性 有 

元 余 类 型 m 复制 奇偶 校 验 

起 性 能 高 

需要 的 磁盘 数 “| RREI 两 个 或 ri 三 块 或 三 块 以 上 
(偶数 个 盘 ) 

"T 磁盘 总 容量 的 | 磁盘 总 容量 和 (N-1) AN 个 磁盘 

50% 的 总 容量 
安全 性 要 求 高 | 安全 性 要 求 高 的 交 | 安全 性 要 求 不 高 的 
的 交易 系统 | 易 系 统 数据 仓库 或 交易 系 


实际 生产 中 用 的 统 
不 多 
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3.2.2. ”条 市 化 


在 上 市 中 ， 多 次 提 到 一 个 词 “ 条 和 带 化 ”。 实 际 上 ， 现 代 存 储 阵 列 、 现 代 操 作 系 统 、 各 种 第 
三 方 软件 都 支持 条 带 化 技术 , 例如 IBM 存储 DS8300 MERRTE, AIX, HP-UX 等 都 在 LVM 
(逻辑 卷 管理 ) 上 支持 条 带 化 ，Oracle 通过 ASM 支持 条 带 化 ，DB2 通过 自动 存储 管理 有 限 支 
持 条 带 化 。 这 一 节 专 门 来 谈 谈 条 带 化 。 

很 多 DBA 都 过 到 过 人 磁盘 冲突 , 位 极 冲 突 是 指 多 个 进程 同时 访问 同一 块 磁 稚 ， 这 是 DO 设计 
中 需要 重点 考虑 的 问题 。 由 于 IO 经 常 是 DB2 的 性 能 瓶 贷 ， 因 此 最 好 的 解决 方法 就 是 使 1O 并 
行 ， 这 就 需要 将 数据 分 布 在 多 个 磁盘 上 以 共同 分 担 TO. 

条 带 化 技术 的 出 现 很 好 的 解决 了 上 述 问题 ， 它 会 将 数据 均匀 地 分 布 到 不 同 的 磁盘 上 ， 同 时 
也 将 负载 分 担 到 多 个 磁盘 上 。 这 样 ， 多 个 磁盘 就 可 以 并 行 工 作 ， 吞 吐 量 会 大 大 提高 。 通 过 条 带 
化 ，DBA 可 以 很 轻松 地 做 到 IO 负载 均衡 而 无 须 去 手工 配置 。 

那么 ， 采 用 条 带 化 技术 后 ， 数 据 在 物理 磁盘 上 是 怎样 分 布 的 ? 和 未 条 带 化 有 什么 区 别 ? 

图 3-3 摘 述 的 是 一 个 未 经 条 带 化 处 理 的 连续 数据 的 分 布 , 所 有 的 数据 会 依次 写 满 三 个 人 厂 盘 ， 
J XBB ST. E 


图 3-4 fis Dg ie SAAR TG AB PETIT) XE EUR T) 48. "EA RETE Extent) 2 
依次 写 入 三 个 人 磁盘， 然后 不 断 循 环 往复 。 


oppo pe i2 [s Je rp |] | | [sle jo |o [ws | se] 
ns pe ps lz jor la| J | [wk kelalla] J [pn be er lilas 


图 3-4 已 经 被 条 带 化 处 理 的 连续 数据 


可 以 发 现 图 3-4 中 对 连续 数据 的 读 写 有 更 大 的 并 发 能 力 ， 如 果 用 户 害 要 读 取 1 到 3 扩展 分 区 
中 的 数据 时 ， 如 果 没 有 条 市 化 ， 上 只 能 从 第 一 块 磁盘 中 该 取 ;， 如 果 经 过 条 市 化 ， 那 么 就 可 以 同时 访 
问 三 个 磁盘 ， 条 市 化 厂 盘 的 速度 是 未 经 条 市 化 磁盘 的 三 倍 。 同 样 ， 如 果 写 入 大 量 数据 ， 在 网 3-3 
中 ， 只 能 操作 一 个 物理 磁盘 进行 号 操作 ， 而 匈 3-4 中 ， 可 以 同时 对 三 块 物理 磁盘 进行 写 操作 。 

当 使 用 条 市 化 时 ， 决 定 条 市 化 效果 的 因素 是 条 禹 深度 (stripe depth) 和 条 市 宽度 (stripe 
width) 。 条 市 深度 指 的 是 条 市 块 的 大 小 ， 也 叫 条 融 单 元 ; 条 市 宽度 指 的 是 一 个 条 市 分 布 的 驱动 
数 。 设 计 人 员 需 要 根据 系统 的 IO 要 求 来 合理 的 选择 这 些 设 置 。 


HE MS 
1. 条 带 深 度 


条 市 的 深度 指 的 是 条 带 的 大 小 ， 也 叫 条 市 单元 。 条 带 化 的 初衷 是 为 了 提高 VO 并 行 性 ， 也 
束 是 说 希望 每 次 VO 操作 ， 都 能 得 到 最 大 程度 的 并 行 。 

条 融 的 配置 和 系统 IO 的 并 发 度 有 关 , CERO OR HEH IO 请 求 的 大 小 都 比较 小 的 情况 下 ， 
4i 28 — Be t Be [e] SEI; do L/O 请 求 ， 这 时 融 需 要 考虑 选择 比较 大 的 条 市 深度 。 在 高 并 发 系 
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AF, KREN (nX page size), EHF n 为 大 于 1 的 整数 。 通 过 粗 粒 度 条 珊 能 实现 最 大 的 IO 
Tr E. 

在 那些 存在 大 的 逻辑 IO 请 求 的 低 并 发 系统 中 ， 需 要 多 块 磁 盘 同 时 啊 应 一 个 VO ik. B 
T IO 请 求 一 般 是 序列 化 的 ， 为 了 避免 出 现 IO 集中 的 热点 人 磁盘， 需要 避免 逻辑 IO 只 被 一 块 
磁盘 处 理 。 这 时 应 该 选择 小 的 条 市 深度 ， 使 一 个 逻辑 UO 分 布 到 多 个 人 磁盘 上 ， 从 而 实现 IO 的 
负载 均衡 ， 这 就 叫 细 粒 度 条 带 。 条 这 深度 的 大 小 必须 为 CnXpage size) ， 其 中 为 小 于 预 取 参 
数 (prefetch size) 大 小 的 整数 。 


比较 : 逻辑 I/O 与 物理 MO 


逻辑 IO， 是 操作 系统 发 起 的 IO， 目 标 数据 可 能 会 在 磁盘 上 ， 也 可 能 会 在 内 存 中 。 

物理 IO， 是 设备 驱动 发 起 的 IO， 从 磁盘 读 取 目 标 数据 。 

逻辑 LO 会 转化 为 物理 VO 请 求 。 在 条 带 化 的 概念 中 ， 一 个 逻辑 IO 会 转化 成 若干 个 物理 
IO， 多 个 逻辑 DO 也 可 以 通过 一 次 大 的 物理 I/O 完成。 


条 市 宽度 指 的 是 条 于 深度 的 产量 或 者 一 个 条 偶 集 中 的 驱动 数 。 无 论 是 一 个 还 是 多 个 磁盘 啊 
应 一 个 逻辑 VO, 都 希望 物理 设备 只 处 理 一 次 /1O。 因 而 在 确定 了 条 带 深度 的 基础 上 , 需要 保证 : 


条 带宽 度 >= I/0 请 求 的 大 小 二 条 市 深度 。 


在 DB2 数据 库 级 别 影 啊 单 次 物理 IO 最 重要 的 因素 殉 是 预 取 大 小 。 为 了 提高 VO 的 性 能 ， 
在 设置 DB2 预 取 大 小 时 ， 必 须 使 其 与 条 融 深 度 和 条 市 宽度 有 较 好 的 匹配 。 首 先 要 保证 的 就 是 预 
取 的 大 小 必须 是 条 带 深 度 的 整数 倍 ， 其 次 预 取 大 小 最 好 是 条 市 深度 与 条 带宽 度 乘积 的 整数 售 。 
这 样 就 可 以 使 预 取 时 所 执行 的 物理 VO 被 均衡 地 分 布 到 所 有 的 物理 存储 中 。 


3.2.3 ”存储 设计 


存储 设计 的 成 败 ， 会 直接 影响 DB2 数据 库 的 性 能 。 这 一 市 将 从 以 下 儿 个 方面 ， 讨 论 DB2 
存储 设计 时 需要 注意 的 一 些 扩 术 要 点 。 


1. RAID 级 别 的 选取 和 设计 


CD 对 于 数据 和 上 日志， 应 选择 不 同 的 RAID 组 ， 建 议 数据 采用 RAID 5 或 者 RAID 10, H 
志 采 用 RAID 10。 
(2) 一 般 小 VO 的 数据 库 类 操作 ，OLTP 应 用 例如 ERP 系统 ， 建 议 采 用 RAID 10， 而 对 于 
OLAP 应 用 例如 数据 仓库 或 者 商业 智能 系统 ， 建 议 采 用 RAID 5. 
人 小 技巧 , 判断 OLTP 还 是 OLAP 
可 以 通过 下 面 的 方法 区 分 应 用 系统 属于 哪 种 类 型 。 如 果 遵 循 70/30/50 原则 , 即 70% 读 、 
30% 写 、Cache 命中 率 50%， 这 就 是 典型 的 高 并 发 的 OLTP 系统 。 如 果 系 统 是 100% 读 ， 则 
这 是 典型 的 OLAP、DSS 系统 。 
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2. 条 市 化 的 使 用 


(1) 要 考虑 DB2 系统 的 IO 特点 ， 以 此 来 选择 存储 上 的 条 市 化 大 小 (stripe size)。 对 于 OLTP 
应 用 ， 数 据 库 UO 基本 是 随机 小 块 恋 写 ， 所 以 选择 较 大 的 条 珊 大 小 可 以 调 高 IO 吞吐 能 力 ; 而 
对 于 OLAP 应 用 ， 数 据 库 IO 是 连续 大 块 谈 写 ， 所 以 选择 较 小 的 条 市 大 小 避免 UO 请 求 局 限 在 
一 块 磁盘 上 。 

(2) 确保 操作 系统 层面 和 存储 层面 的 条 融化 大 小 设置 一 致 。 

(3) 最 多 只 能 采用 两 次 条 融化 ， 条 融化 并 不 是 越 多 越 好 。 存 储 设备 是 通过 RAD 实现 条 
带 化 的 ， 而 DB2 是 通过 表 空 间 容 器 实现 条 带 化 。 从 最 佳 实践 的 角度 出 发 ， 建 议 条 带 化 不 要 超 
过 两 次 。 

3. DB2 自动 存储 管理 技术 


DB2 目 动 存储 管理 (Automatic Storage Management) 技术 是 为 数据 库 配 置 存 储 的 一 种 简单 
而 有 效 的 方式 。 例 如 创建 数据 库 MYDB 的 CREATE DATABASE 语句 : 


CREATE DATABASE MYDB ON /datal, /data2, /data3 DBPATH ON /mydbpath 


上 面 的 命令 有 3 个 存储 路 径 ， 分 别 为 datal. data2 和 data3 。 每 个 存储 路 径 都 是 一 个 单独 的 
文件 系统 ， 每 个 文件 系统 都 是 通过 专用 的 LUN 创建 的 。DBPATH 参数 被 设 为 另 一 个 单独 的 文 
件 系 统 /mydbpath， 事 务 日 志和 DB2 元 数据 都 存放 在 这 个 文件 系统 上 。 


¿à 注意 : CREATE DATABASE 语句 
默认 的 情况 下 , 在 使 用 CREATE DATABASE 命令 创建 数据 库 时 将 启用 自动 存储 管理 。 


DB2 存储 管理 器 使 用 简单 的 条 带 化 方法 ， 可 确保 并 行 性 ， 不 至 于 使 某 个 存储 路 径 过 早 地 被 
填 满 。 

当 需 要 为 数据 库 增 加 衬 间 时 ， 应 尽量 均衡 扩展 所 有 已 有 的 路 径 。 也 就 是 说， 等 量 地 增加 每 
个 文件 系统 的 容量 。 例 如 ， 为 了 给 数据 库 MYDB 增加 空间 ， 最 佳 选 择 是 等 量 增 加 文件 系统 
/datal 、/data2 和 /data3 的 容量 。 

如 果 不 能 均衡 扩展 存储 路 径 , 那 么 使 用 ALTER DATABASE 命令 的 ADD STORAGE ON f 
名 增加 一 组 新 的 存储 路 径 。 这 组 新 的 存储 路 径 应 该 与 原 有 存储 路 径 有 相同 的 存储 容量 ， 例 如 下 
面 的 命令 新 增加 一 组 存储 路 径 ， 分 别 为 /data4. /data5 和 /data6. 


ALTER DATABASE ADD STORAGE ON /data4, /datab5, /datae 
4. 与 存储 相关 的 DB2 配置 参数 
(1) DB2 PARALLEL IO 注册 变量 
DB2 PARALLEL IO 允许 用 户 指 定 受 影响 的 表 空 间 和 每 个 容器 的 并 行 度 ， 即 每 个 容器 下 
面 的 磁盘 数目 。 一 个 合理 的 DB2 PARALLEL IO 设置 如 下 : 


db2set DB2 PARALLEL IO- *:4 


“*” 通 配 符 告诉 DB2 T3128 Hx 4r E SUPER] e IR). qf HEAR a DL CE 4。 
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(2) 使 用 NO FILE SYSTEM CACHING 子 名 

在 一 些 情形 下 ，DB2 Wu A CfEZREEZE TER TER] n x no REX ETE ELSE f£ LOB. 数据 表 
的 情形 中 。 因 为 这 些 LOB 数据 不 会 号 入 DB2 缓冲 池 ， 所 以 使 用 文件 系统 缓存 性 能 会 有 助 于 
IO 读 取 的 性 能 。 

但 是 ， 在 很 多 场景 下 ， 使 用 文件 系统 绥 存 并 不 会 融 来 性 能 的 提升 ， 所 以 需要 将 文件 系统 组 
存 关 闭 ， 这 可 以 通过 在 CREATE TABLESPACE 和 ALTER TABLESPACE 命令 使 用 NO FILE 
SYSTEM CACHING 子 句 来 实现 。 

NO FILE SYSTEM CACHING 子 句 用 于 局 用 非 缓冲 WO， 从 而 禁用 特定 表 空 间 的 文件 高 速 
缓存 ， 这 样 数据 库 管 理 器 束 会 目 动 使 用 直接 UO 或 者 并 发 IO。 


比较 : 直接 1/0 与 并 发 VO 

直接 VO (DIO )， 通 过 直接 将 数据 从 磁盘 复制 到 合适 的 缓冲 区 ， 消 除了 与 缓存 UO 关联 的 
双重 缓冲 。 但 是 ， 直 接 UO 执行 了 写 入 序列 化 和 Inode 锁定 来 维护 数据 完整 性 。 

并 发 IO (CIO )， 提 供 了 对 数据 的 直接 访问 能 力 ， 无须 额 外 的 缓冲 和 锁定 ， 可 以 允许 多 个 
线程 并 发 地 读 写 相同 文件 中 的 数据 。 


5. 日 志和 数据 分 开 


DB2 事务 在 进行 增删 改 的 时 候 需 要 先 写 日 志 才 能 提交 , 这 意味 着 日 志 的 写 入 速度 对 性 能 
很 大 影响 。 因 此 ， 要 把 日 志 缉 从 物理 上 单独 分 出 来 ， 最 好 规划 成 RAID 10， 给 予 最 遇 优 先 级 ， 
防止 数据 读 写 与 日 志 写 之 间 竞 争 磁 头 。 

与 日 志 盘 不 同 ， 数 据 盘 的 容量 需求 比较 大 ， 对 于 读 的 要 求 更 局 一些， 再 加 上 DB2 的 数据 写 
部 是 异步 的 ， 所 以 对 写 入 速度 要 求 高 的 场景 下 选择 RAID 10， 人 否则 选择 RAID 5. 

6. 尽量 发 挥 文件 系统 的 CIO 和 DIO 能 力 ， 减 少 裸 设备 的 使 用 


裸 设备 与 文件 系统 的 最 大 不 同 在 于 它 可 以 避 开 文件 系统 的 缓存 以 及 锁 机 制 ， 因 此 ， 可 以 通 
过 裸 设备 提高 数据 库 的 性 能 。 但 是 ， 裸 设备 的 次 端 是 可 管理 性 差 ， 容易 出 问题 ， 而 且 不 被 DB2 
的 自动 存储 管理 特性 所 文 持 。 

随 着 文件 系统 的 技术 发 展 ， 现 在 许多 文件 系统 ， 例 如 AIX 下 面 的 JES2 都 支持 CIO 模式 ， 
也 就 是 说 可 以 利用 文件 系统 的 CIO 或 DIO 能 力 达 到 与 裸 设 备 相似 的 性 能 , 而 且 还 兼顾 了 可 管理 
性 和 安全 性 。 

开启 CIO/DIO 有 两 种 方法 : 第 一 种 方法 是 将 文件 系统 mount 成 CIO 或 DIO， 这 样 做 会 导 
致 被 mount 的 文件 系统 上 所 有 文件 都 使 用 CIO 或 DIO; 第 二 种 方法 在 创建 或 修改 表 空 间 时 指定 
NO FILE SYSTEM CACHING 属性 ， 它 只 是 对 表 空 间 所 对 应 的 容器 使 用 CIO/DIO， 并 不 会 影响 
到 文件 系统 上 的 其 他 文件 。 

无 论 使 用 上 述 哪 种 方法 开局 CIO 或 DIO， 都 必须 在 操作 系统 中 正确 地 安 儿 和 配置 AIO 库 。 
AIO 库 在 Linux 平台 和 AIX 平台 的 安装 、 配 置 方法 是 有 区 别 的 , 在 Linux 平台 使 用 CIO 或 DIO 
maA AIO FEES. NW: 
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rom =q libaio 
libaio=0.3.,106=3,2 
libaio=0.3.,106=3.,2 


如 果 aio 库 已 经 安装 ， 下 一 步 需要 在 /etc/sysctl.conf 文件 中 配置 AIO 的 内 核 参 数 ， 并 执行 
sysctl -p 命令 让 配置 生效 。 


fs.aio-max-nr = 1048576 


AT AIX 系统 中 如 何 配置 AIO， 请 读者 参考 本 书 第 11 章 11.3.4 小 节 有 关 IOCP 的 内 容 。 


3.2.4 为 电信 公司 规划 存储 


从 3.1.4 小 节 了 人 解 到 ， 这 个 电信 公司 最 终 采 用 了 DS8300 存储 阵列 ， 总 共 配 置 24 块 物理 盘 ， 
fax 300GB， 最 终 选 择 RAID 10 技术 。 首 先 ， 在 数据 高 可 靠 性 方面 ，RAID 10 技术 可 以 满 
足 公 司 对 数据 高 可 靠 性 的 要 求 ， 其 次 ， 在 读 写 性 能 方面 ，RAID 10 技术 提供 较 高 的 读 写 性 能 
以 满足 应 用 系统 的 要 求 ， 最 后 ， 在 磁盘 容量 方面 ， 可 以 满足 公司 未 来 5 年 的 发 展 需 要 。 

具体 划分 如 下 : 其 中 8 块 盘 划 分 一 个 LUN 用 于 存放 日 志 ， 总 容量 为 8/2 X300GB=1200GB:; 
12 块 盘 划分 一 个 LUN， 用 于 存放 数据 和 索引 ， 总 容量 为 12/2X300GB=1800GB; 将 剩余 4 E 
化 为 一 个 LUN 用 于 存放 临时 数据 和 文件 ， 总 容量 为 42X300GB=600GB。 

另外 ， 考 虑 到 裸 设备 难于 管理 ， 而 且 性 能 也 未 必 比 文件 系统 好 ， 所 以 最 终 选择 文件 系统 。 
最 终 存 储 与 文件 系统 设计 如 表 3-3 所 示 。 


表 3-3 存储 与 文件 系统 设计 
文件 系统 mis 
/db2log LUN! RAID 10 1200GB 存放 日 志 
jab2data 存放 数据 
ab2index 存放 索引 


Jäb2temp 600GB 存放 临时 数据 


测试 存储 的 实际 读 写 速度 ， 是 存储 设计 阶段 必须 要 做 的 事情 ， 这 样 做 的 好 处 是 : 第 一 ， 可 
以 验证 是 否 能 满足 数据 库 系 统 的 UO 要 求 ; 第 二 ， 可 以 对 当前 存储 器 VO 性 能 有 准确 的 了 解 ， 
从 而 为 后 期 性 能 调 优 做 参考 。 

人 下面 使 用 dd 命令 测试 /db2data 文件 系统 的 读 写 能 力 ， 这 里 的 文件 系统 /db2data 实际 对 应 看 
一 个 存储 器 上 划分 的 LUN， 测 试 结果 表明 可 以 满足 VO 需要 。 


[rootadb2 -«]4 dd if-/dev/zero of-/db2data/test.file bs-8192 count-5000000 
SUDO DEO records in 

5000000+0 records out 

40960000000 bytes (41 GB) copied, 179.411 seconds, 228 MB/s 


3.25 ”为 电信 公司 创建 数据 库 
上 一 节 完成 存储 设计 后 ， 接 下 来 就 可 以 创建 数据 库 了 ， 语 句 如 下 所 示 : 


create database crmdb automatic storage yes on /db2data dbpath on /db210g ALIAS cdb 
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using codeset UTF-8 territory CN pagesize 8 k; 


这 个 数据 库 的 名 字 为 crmdb， 以 表示 这 是 客户 关系 管 理 系统 数据 库 ， 下 面 介 绍 一 下 上 面 命 
令 中 其 他 选项 的 具体 含义 ， 

e automatic storage yes: 表示 使 用 目 动 存储 管理 功能 ， 其 中 目 动 存储 路 径 “/” 为 db2data. 
关于 目 动 存储 表 衬 间 的 具体 介绍 ， 请 阅读 3.3.1 市 有 关内 容 。 

e dbpath on /db2log: 指定 数据 库 crmdb 的 事务 日 六 和 元 数据 存储 路 径 ， 当 然 也 可 以 随时 
通过 修改 数据 库 配 置 参数 NEWLOGPATH 来 调整 。 

e ALIAS cdb: 指定 crmdb 的 别名 为 cdb。 

e codeset UTF-8: 指定 crmdb 数据 库 使 用 UTF-8 编 杷 ， 这 样 可 以 存储 各 种 语言 的 内 容 。 

e territory CN: 它 决定 数据 库 中 的 时 间 和 日 期 格式 为 中 文 。 

e pagesize 8 k: 指定 数据 库 的 默认 页 大 小 为 SKB， 为 什么 要 选择 8KB, 请 阅读 3.3.4 节 有 
天 内容 。 


mia NL > 
L 
3.3 ” 表 空 日 估计 
表 空 间 是 数据 的 载体 ， 也 是 数据 库 逻 辑 层 与 物理 层 之 间 的 接口 ， 表 空间 的 规划 和 管理 与 底 
层 存储 的 规划 和 管理 密 不 可 分 ， 在 这 一 节 ， 将 深入 讲解 DB2 表 空 间 有 关内 容 。 
3.9.1 表 空 间 管理 方式 
表 空 间 是 数据 库 中 的 一 个 存储 结构 ， 表 、 索 引 和 大 对 象 数 据 (LOB 和 LONG) 都 被 创建 在 
表 空 间 中 。 作 为 应 用 开发 人 员 ， 只 需要 了 解 到 表 空 间 一 层 , 不 需要 关心 表 空 间 的 物理 存储 结构 。 
作为 运 维 人 员 ， 需 要 深入 了 解 表 空 间 的 物理 组 织 结构 。 
我 们 在 技术 交流 的 时 候 ， 发 现 很 多 DBA 并 不 熟悉 DB2 表 空 间 的 管理 方式 ， 接 下 来 深入 探 
a To 
1. 系统 管理 表 空 间 (SMS) 


系统 管理 表 空 间 是 指 在 创建 表 空 间 时 指定 MANAGED BY SYSTEM 选项 , 并 且 指 定 一 个 或 
若干 操作 系统 路 径 。 容 器 会 被 创建 在 这 些 路 径 当 中 ， 一 个 容器 文件 中 只 包含 一 个 对 象 的 数据 ， 
因此 有 多 少 对 和 象 束 会 有 多 少 个 容器 文件 。 容 器 不 事先 分 配 ， 而 是 随 看 数据 的 插入 或 删除 ， 容 器 
文件 的 大 小 上 自动 调整 。 

例如 ， 下 面 的 语句 创建 了 系统 管理 表 衬 间 SMSTS: 

GRIESE MS 


MANAGED BY SYSTEM 
USING ("/pathil”", /atn22， XS Em ) 


TE GJ £E de "x RISE AIR EA Tte. enn] a DOSES N RME Te ESSEN TE, —^" 
文件 中 只 有 一 个 对 象 的 数据 ， 其 物理 存储 结构 如 图 3-5 所 示 。 如 采 在 表 空 间 上 创建 了 表 A 并 插 
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入 了 在 干 记录 ， 和 那么 在 路 径 1、 路 径 2 MRI amek (sus) 
下 面 都 会 出 现 文件 SQL00001.DAT。 如 果 再 创建 
另 一 个 表 ， 会 出 现 另 一 个 文件 SQL00002.DAT， 
一 般 每 个 数据 库 实 体 对 象 〈 比 如 表 或 索引 ) 对 应 


一 个 文件 名 。 


那么 SMS ép], mtb AW? 在 Table A DATA1 Table A DATA2 


DB2 中 ， 采 取 轮 循 (Round Robin) 的 方式 。 也 — "M RUM 
就 是 说 , 当 一 个 扩展 块 的 数据 写 到 路 径 1 下面 的 路 径 1 路 径 2 路 径 3 


文件 后 , 接 下 来 一 个 扩展 块 的 数据 写 到 路 径 2 下 AA E 


面 的 文件 中 ， 再 接着 一 个 扩展 块 数据 写 到 路 径 3 下 面 的 文件 中 ， 最 后 ， 又 会 翻 回来 写 路 径 1, 
如 此 反复 。 

采用 系统 管理 表 空 间 ， 用 户 无 须 上 自己 管理 ， 一 切 由 系统 进行 打 理 ， 好 处 是 比较 简单 ， 管 理 
方便 ， 但 是 性 能 上 不 一 定 是 最 佳 的 。 一 般 系 统 临时 表 空 间 会 使 用 系统 管理 表 空 间 。 

2. 数据 库 管 理 表 空 间 (DMS) 


在 创建 由 数据 库 管 理 的 表 衬 间 时 ， 需 要 指定 具体 的 文件 或 裸 设 备 作为 容 右 ， 表 空间 的 所 有 
对 和 象 都 被 放 在 这 些 容 器 中 ， 一 个 文件 里 面 可 以 有 不 同 对 象 的 数据 。 文 件 的 存储 衬 间 会 预先 分 配 
好 ， 在 预 分 配 的 存储 空间 用 完 以 后 可 以 手动 或 者 目 动 旭 加 空间 。 
fun, nmm Ae rus" DMSTS: 
CERBERTEOTABISNSPACUCREODMSTS 
MANAGED BY DATABASE 
USING (FILE “/pathi/dmsdartal” 5000, 


Ip TE a "/partchnz2/cmecdata2Y 5000, 
FILE "/parh3/dmsdata3” 5000) 


HEE ERTER ARS SMS KEWA, Aire RNA maA, d 
物理 存储 结构 如 图 3-6 所 示 。 从 图 3-6 可 以 看 出 ，DMS 表 衬 间 的 数据 读 写 也 采用 了 轮 循 方式 ， 
即 数据 从 第 一 个 容器 开始 写 入 ， 写 完 一 个 扩展 块 写 第 二 个 容 右 的 扩展 块 ， 依 次 类 推 ， 最 后 再 返 
问号 第 一 个 。 

采用 数据 库 管 理 表 罕 间 ， 好 处 是 性 能 比较 高 效 ,， 但 是 管理 上 稍微 复杂 一 点 ， 下 面具 体 来 讲 。 

(1) 改变 数据 库 管 理 表 空 间 (DMS) 容器 的 大 小 

下 面 的 例子 将 表 空 间 DMSTS 的 三 个 容 融 重 设 为 2000 个 页 大 小 ，RESIZE BE n] AJER A I 
大 也 可 以 把 容器 缩小 。 

ALTER TABLESPACE DMSTS 

PRECIZE (FILE '/pathl/dmsdatal' 2000, 


FILE '/path2/dmsdata2' 2000, 
PILE patho / dm- daat 992: 90D) 


如 果 表 空间 的 属性 AUTORESIZE 被 设 为 YES， 则 不 需要 手动 管理 表 空 间 容 器 的 大 小 ， 只 
需要 保证 相应 的 操作 系统 还 有 足够 的 空间 即 可 。 但 AUTORESIZE 只 能 加 大 容器 ， 要 缩小 容器 
还 需要 手动 执行 ALTER TABLE…RESIZE 操作 。 
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已 理 表 空间 容 占 尺寸 的 最 佳 实践 是 保证 容器 的 扩展 是 等 大 小 的 ， 这 样 可 以 防止 热 区 的 出 
Mo MRAK, PERKET- ARATA HARRAK, TES EV R H 
Sig T HAE RA EE o 

XE 6 ER US EA, RUOLI T ER SCRI RRR, ENA B. EA R 
头 ， 这 样 可 以 最 大 限度 地 利用 并 行 WO。 如 图 3-7 所 示 ， 在 读 扩 展 块 4 的 同时 可 以 读 扩展 块 5 
和 6。 如 条 东 一 个 容 露 比 其 他 容器 大 ， 在 其 他 容 圳 空间 用 尽 后 会 集中 使 用 一 个 容 如 ， 这 样 扩展 


块 10~12 不 能 同时 被 并 行 访 问 ， 并 且 导 致 休 个 人 磁盘 访问 量 大 于 其 他 磁盘 ， 产 生 读 与 冲 突 ， 影 啊 
谈 写 性 能 ， 因 此 在 规划 中 要 尽量 避免 这 种 热 区 。 
数据 库 管理 表 空 间 (DMS) 


T'*|. Table A Data 4 | 


| | TableBEMP /| | TableB Data 1 

| k Table A Data 14 | |. Table A Data 2 

A 2 条 带 
Object Table 


C0000001.LRG C0000002.LRG 
路 径 3 
E 3-6 DMS 表 空 间 容 器 的 存储 结构 图 3-7 DMS 表 空 间 容器 的 热 区 


(20 为 数据 库 管 理 表 空间 (DMS) 增加 容器 

在 某 些 情况 下 ， 原 有 的 磁盘 已 经 没有 空间 ， 这 时 就 需要 为 表 空 间 增加 容器 ， 把 容器 放 到 其 
他 的 空闲 磁盘 上 。 如 果 为 数据 库 管理 表 空 间 增加 容器 ， 会 导致 数据 自动 重新 分 布 。 

下 面 例子 中 ， 为 表 空 间 DMSTS 增加 两 个 2000 个 页 大 小 的 容器 。 


ALTER TABLESPACE DMSTS 
APD rre A A000 — Je Ton esie oS w/ ole tele ve 0 


如 图 3-8 所 示 ， 初 始 阶段 有 两 个 容器 C0 和 C1， 数据 为 t0， 当 增加 两 个 容器 C2 和 C3 时 ， 
会 目 动 触 友 数据 重新 平衡 ，t0 的 数据 被 平均 分 布 到 了 容器 C0. C1. C2 和 C3。 所 以 使 用 这 个 命 
令 要 小 心 ， 最 好 是 在 工作 负载 比较 低 的 时 间 进 行 ， 人 否则 数据 重 新 分 布 会 对 系统 性 能 产生 影 啊 。 


初始 两 个 容器 新 语 加 两 个 容器 ESSEN 
co Ct C0 c1 C2 C3 CO C1 c2 ca. 
tofikol EE toj ito; '(£0/' [£0]: :to [t0]: 


E 3-8 DMS 表 空 间 添 加 容器 后 的 过 程 


(3) 为 数据 库 管理 表 空 间 CDMSO 增加 条 带 集 (stripe set) 

如 果 在 增加 容器 的 时 候 ， 不 希望 立刻 进行 数据 自动 重新 分 布 ， 这 可 以 通过 为 表 空 间 增 加 条 
带 集 Cstripe set) REIM. 这样 只 有 原 有 的 容器 用 完了 , 才 会 用 新 的 容器 。 下 面 的 命令 为 DMSTS 
表 空 间 增加 了 一 个 新 的 stripe set， 其 中 包含 两 个 容器 文件 ， 初 始 大 小 都 为 2000 页 。 
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ALTER TABLESPACE DMSTS begin new stripe set ( 
file '/path4/dmsdata4' 2000, 
file oathb5/sdmscdstab^ 2000) 


3. 自动 存储 表 空 间 (Automatic Storage) 

在 DB2 中 ， 经 常会 提 到 目 动 存储 表 空 间 。 所 谓 目 动 存 储 并 不 是 一 种 新 的 表 空 间 管 理 形式 ， 
它 实 际 上 还 是 使 用 DMS， 只 不 过 在 创建 表 空 间 时 不 需要 指定 任何 路 径 或 者 文件 ，DB2 会 在 指 
定 的 路 径 创 建 容 堪 ， 并 且 保 证 数据 可 以 均匀 地 分 布 在 这 些 容 项 中 。 
下 面 的 语句 ， 给 数据 库 增 加 了 三 个 存储 路 径 ， 分 别 为 /path1、/path2 和 /path3: 


ALTER DATABASE ADD STORAGE ON '/path1', '/path2', '/path3' 


为 自动 存储 管理 的 数据 库 添 加 路 径 以 后 ， 并 不 会 马上 利用 到 这 些 存储 路 径 ， 直 到 原 有 路 径 
的 空间 用 尽 ， 这 点 与 DMS 正好 相反 。 

如 图 3-9 所 示 ， 初 始 阶段 有 两 个 路 径 COGI C1， 数 据 为 tb， 添 加 两 个 路 径 C2 和 C3 后 ， 并 
不 会 触发 数据 重新 分 布 ， 接 下 来 的 数据 tl 会 继续 使 用 路 径 CO ICI 直到 CO 和 C1 用 完 为 止 ， 
这 时 再 到 来 的 数据 t2 就 会 被 放 在 新 的 路 径 C2 和 C3 了 。 


初始 两 个 路 径 新 请 加 两 个 路 径 新 来 的 数据 继续 使 用 原 有 在 原 有 路 径 空 间 用 完 后 才 
的 路 径 使 用 新 的 路 径 
CO C1 ED 61r c3 CO C1 C2 C3 CO C1 C2 C3 


e m 


: i 


EE ==. soe »— AS Om (QE UE 


r 一 LL PP mm mm Pr 一 一 


Bo n 


AN 


QUESO  — 3133000 


图 3-9 为 自动 存储 管理 数据 库 添 加 存储 路 径 


3.3.2” 表 空间 类 型 
上 一 节 介 绍 了 表 空 间 的 管理 方式 ， 本 节 将 介绍 DB2 中 不 同 的 表 空 间 类 型 , 根据 用 途 可 以 分 
为 以 下 5 种 。 
CIO 系统 编目 表 空 间 
在 创建 数据 库 之 后 ，DB2 默认 会 自动 创建 ， 名 字 为 SYSCATSPACE， 用 来 存放 表 的 定义 、 
授权 和 统计 信息 等 系统 数据 。 
(2) 系统 临时 表 空 间 
默认 创建 ， 名 字 为 TEMPSPACE1， 用 于 存储 SQL 操作 期 间 包 括 排 序 、 表 连接 等 所 需要 的 
内 部 临时 数据 。 
(3) 用户 临 时 表 空 间 
默 . 认 不 创建 ， 用 于 存储 临时 表 。 
(4) 常规 表 空 间 
用 于 存放 数据 或 索引 ,常规 表 空 间 上 只 能 文 持 单 表 最 大 尺寸 为 S12GB 的 数据 ,现在 不 建议 使 
用 常规 表 空 间 了 。 
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(5) 大 型 表 空间 
从 DB2 V9 开始 引入 ， 从 字面 上 可 以 看 出 大 型 表 空间 的 容量 要 比 第 规 表 空间 更 大 ， 可 以 文 
持 单 表 最 大 尺寸 为 16TB 的 数据 ， 建 议 使 用 。 


3.3.3” 表 空间 参数 设置 
使 用 CREATE TABLESPACE 命令 创建 表 空间 时 ， 可 以 指定 下 面 儿 个 参数 ， 这 几 个 参数 对 


性 能 有 重要 影响 ， 当 然 也 可 以 在 创建 后 通过 ALTER TABLESPACE 语句 修改 。 
1. 页 大 小 (Page Size) 


DB2 支持 的 页 大 小 ， 有 4KB、8KB、16KB 和 32KB 四 种 ， 如 表 3-4 所 示 ， 不 同 页 大 小 的 
表 空 间 允 许 的 单 表 最 大 尺寸 是 有 限制 的 ， 其 中 ， 从 DB2 V9 开始 支持 大 型 表 空 间 ， 其 中 在 32KB 
页 大 小 情况 下 ， 单 表 最 大 尺寸 可 以 达到 I6TB. 


表 3-4 单 表 支 持 的 最 大 尺 二 
页 大 小 DB2 V9 单 表 最 大 尺寸 
4KB 2TB 
SKB 4TB 
16KB ST 
32KB 16TB 


那么 ， 如 何 选 择 页 大 小 呢 ?” 这 要 根据 不 同 的 应 用 来 定 。 针 对 OLTP 事务 型 应 用 ， 由 于 以 随 
机 读 写 为 主 ， 采 取 较 小 的 页 面 ， 例 如 4KB 或 8KB 更 合适 。 针 对 OLAP 分 析 型 应 用 ， 由 于 以 连 
续 大 片 读 为 主 ， 采 取 较 大 的 页 面 ， 例 如 16KB 或 32KB 更 合适 。 

2. 扩展 块 大 小 (Extent Size) 


大 家 知道 ， 数 据 是 以 extent FÆR) 为 单位 存放 的 ， 一 个 extent 由 一 个 或 多 个 页 组 成 ， 
HOA CEXTENTSIZEO 在 创建 表 空 间 时 指定 。 一 般 RAID 条 带 大 小 是 32KB. 64KB, 128KB 
等 ， 表 空间 的 EXTENTSIZE 应 该 被 设置 成 可 以 包含 一 个 RAID 条 市 的 页 数 ， 计 算 公 式 为 : 


EXTENTSIZE = Stripe Size (KB) / Page Size (KB) 

例如 ， 在 一 个 4D+1P 的 RAID 5 磁盘 阵列 ， 条 从 大 小 是 512KB。 如 果 页 大 小 使 用 8KB， 
那么 EXTENTSIZE 设置 为 64 (512KB / 8KB ) 比较 合适 。 

3， 预 取 大 小 (Prefetch Size? 

预 取 操作 在 查询 使 用 所 需 的 数据 之 前 读 入 这 些 数据 ， 因 为 数据 已 经 在 内 存 中 了 ， 这 样 就 不 
必 等 待 执 行 WO 了 。 

通过 使 用 ALTER TABLESPACE 语句 可 以 轻易 地 修改 预 取 大 小 , 如 果 表 空间 驻 留 在 一 个 厂 
生 阵 列 上 ， 最 优 设 置 如 下 : 


PREFETCH SIZE = EXTENTSIZE * (RAID 数据 盘 的 个 数 ) 
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例如 表 空 间 驻 留 在 一 个 4D+1P 的 RAID 5 磁盘 阵列 上 ,由 于 数据 盘 的 个 数 为 4, 那 么 Prefetch 
Size 的 设置 如 下 : 


PREFETCH SIZE = EXTENTSIZE * 4 


当然 ， 从 DB2 V9 Um, n EAE GI ERT TRIBNS fe, Prefetch Size 设置 为 Automatic， 这 
样 就 可 以 目 动 了 预 取 大 小 了 。 


3.3.4 为 电信 公司 设计 表 空 间 
这 个 电信 公司 的 数据 库 系统 以 事务 型 为 主 ， 分 析 型 为 辅 。 我 们 从 上 一 节 知 道 ， 事 务 型 应 用 
随机 读 写 数据 的 频率 非常 蜗 ， 通 常 选择 较 小 的 页 大 小 ， 这 样 可 以 减少 绥 冲 区 空间 ; 分 析 型 应 用 
以 长 事务 为 主 ， 一 次 访问 大 量 连续 数据 的 频率 非常 局， 通 第 选择 较 大 的 页 大 小 ， 这 样 可 以 降低 
I/O 请 求 次 数 。 
针对 这 个 电信 公司 的 业务 系统 特点 ， 我 们 对 表 空 间 做 了 如 下 设计 : 
CIO. 选择 页 大 小 大 小 为 8SK， 这 样 可 以 较 好 的 文 持 事 务 型 ， 也 能 兼顾 分 析 型 。 
(2) 选择 扩展 块 大 小 为 32。 根 据 3.2.4 市 的 存储 规划 ，12 块 盘 划分 一 个 LUN， 组 成 RAID10， 
用 于 存放 数据 和 索引 ， 条 带 大 小 是 SI2KB, MWA EXTENTSIZE 设置 为 64 (512KB /8KB) . 
(3) 预 取 大 小 。 目 前 使 用 的 DB2 版 本 为 DB2 V9 FP5， 可 以 在 创建 表 空间 的 时 候 ， 将 Prefetch 
Size 设置 为 Automatic， 这 样 束 可 以 目 动 预 取 大 小 了 。 
(40 放弃 自动 存储 管理 ， 选 用 DMS 表 空 间 ， 这 样 可 以 灵活 定义 。 
(5) 数据 和 索引 使 用 不 同 的 表 空 间 存 储 。 
(6) 将 热度 不 同 的 表 放 置 于 不 同 的 表 空 间 。 
(7) 每 个 表 空 间 使 用 独立 的 缓冲 池 。 
根据 上 面 的 设计 ， 一 共 规 划 4 个 大 型 表 空 间 : KER TSDHISTORY 用 于 存放 历史 冷 数据 ; 
TSDCURRENT 用 于 存放 当前 热 数 据 ; TSIHISTORY 存放 历史 冷 数据 的 索引 ; TSICURRENT 存 
放 当 前 热 数据 的 索引 ;最 终 表 空 间 规划 情况 如 表 3-5 所 示 ， 其 中 文件 系统 /db2data 和 /db2index 
在 3.2.4 节 讲 过 ; 绥 冲 池 tsdbhis、tsdbcur 、tsibhis 和 tsibcur 将 在 3.4.5 节 讲 解 。 


表 3-5 表 空 间 规 划 
表 空间 容器 个 数 缓冲 池 用 途 
TSDHISTORY /db2data tsdbhis | 256GB 历史 冷 数据 
TSDCURRENT /db2data tsdbcur | 128GB 当前 热 数据 


TSIHISTORY /db2index 128GB 是 Ji S ve RR S 
ISICURRENT jbzindex | tiber | 64GB | 是 — [ RARS 


根据 表 3-5 的 规划 ， 下 面 是 创建 表 空 间 的 语句 ， 谈 者 需要 注意 ， 每 个 表 空 间 共 有 不 同 的 容 
途 个 数 ， 每 个 表 空 间 上 其 有 不 同 的 初始 化 大 小 ， 但 尺寸 部 是 目 调 整 的 。 


mz jam om 


Fu 


create large tablespace TSDHISTORY pagesize 8 K managed by database 


using ( 
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FILE AH uec AUTE SEG IS OTT . DAT 16 G, 
PILE '/db2data/TSDHISTORYCO02. DAT” 16 G, 
PILE '/db2data/TSDHISTORYCO03. DAT” 16 G, 
PILE '/db2data/TSDHISTORYCOO4. DAT” 16 G, 
PILE '”/db2data/TSDHISTORYCO05S. DAT” 16 G, 
PILE '/db2data/TSDHISTORYCO0G. DAT”? 16 G, 
PILE '/db2đdata/TSDHISTORYCO07. DAT” 16 G, 
FILE "/db2data/TSDHISTORYCOO0S. DAT” 16 G, 
FILE "/db2data/TSDHISTORYCO09. DAT” 16 G, 
FILE "/db2data/TSDHISTORYC0OL0. DAT” 16 G, 
ETELE S ee TOF OE DAT ae, 
EILEAN db aea T PE TO O AU e G, 
FILE "/db2data/TSDHISTORYC0OIL3. DAT” 16 G, 
区 TT DT RY Ol DAL TO 
PILE '"'/édo2data/rTSsSDiISTORYCO015. DAT 16 G, 


pieEe /dae LT DNL S TOYS O0) TE DAT ICG 

) autoresize yes extentsize 64 prefetchsize automatic bufferpool tsdbhis; 
create large tablespace TSDCURRENT pagesize 8 K managed by database 
using ( 

FILE "/dio2darta/TSDCURRENTCOOL. DAT” 16 
FILE "/dio2darta/TSDCURRENTCOO2 DAT” 16 
FILE "/dio2darta/TSDCURRENTCOO3. DAT 16 
FILE "/dio2darta/TSDCURRENTCOO4A. DAT” 16 
FILE "/dio2darta/TSDCURRENTCOO5S. DAT” 16 
FILE "/dio2darta/TSDCURRENTCOOG. DAT” 16 
PILE "/dio2darta/TSDCURRENTCOO7. DATY 16 G, 

ETER /dp2da eS To DCURRENTCOO0S DATOG 

) autoresize yes extentsize 64 prefetchsize automatic bufferpool tsdbcur; 


create large tablespace TSIHISTORY pagesize 8 K managed by database 
using ( 

PILE '/db2index/TSIMISTORYCOOIL. DAT” 16 
PILE '/db2index/TSIĦMISTORYCO02. DAT” 16 
PILE /do2index/TSINISTORYCO003. DAT” 16 
PILE "/db2index/TSIMISTORYCO04. DAT” 16 
PILE /de2index/TSINISTORYCO005. DAT” 16 
PILE "/db2index/TSIMHISTORYCOO0G. DAT” 16 
PILE '/db2index/TSIHISTORYCO7. DAT” 16 G, 

PILE /db2index/TSINISTORYCO008 DAT” 16 G 

) autoresize yes extentsize 64 prefetchsize automatic bufferpool tsibhis; 


G 
G 
G, 
G 
G 
G 


create large tablespace TSICURRENT pagesize 8 K managed by database 
using ( 

PILE “/cdio2index/TSICURRENTCOOL. DATY 16 G, 

FILE “/do2index/TSICURRENTCOO2. DAT” 16 G, 

FILE “/dio2index/TSICURRENTCO0O3. DAT 16 G; 

FILE "/dio2index/TSICURRENTCOO4., DATY 16 G 

) autoresize yes extentsize 64 prefetchsize AUTOMATIC bufferpool tsibcur; 


3.4 AFAIRE EJE 


从 DB2 V9.5 开始 ，DB2 采用 了 多 线程 模型 ， I 新 的 内 存 
模型 使 得 更 多 的 内 存 可 以 作为 共享 内 存 使 用 ， 并 且 可 以 动态 调 这 为 数据 库 的 内 存 配置 提供 


94 


$353 高 质量 物理 设计 m 


了 极 大 的 便利 。 这 一 节 关 于 内 存 模型 的 介绍 主要 是 基于 DB2 V9.5 及 以 上 版 本 。 


3.4.49 解密 DB2 内 存 


从 图 3-10 可 以 看 到 DB2 的 各 个 内 存 区 域 ， 例 如 INSTANCE MEMORY 代表 了 整个 实例 可 
以 使 用 的 最 大 内 存 数 ， 包 括 实 例 共 享 内 存 、 数 据 库 共享 内 存 、 应 用 程序 全 局 内 存 和 代理 私有 内 
存 。 如 果 把 INSTANCE MEMORY 设 成 AUTOMATIC, DB2 会 根据 操作 系统 的 物理 内 存 大 小 
给 数据 库 分 配 特定 大 小 的 内 存 ; DATABASE MEMORY 代表 了 数据 库 共 享 内 存 的 大 小 ; 
APPL MEMORY 代表 了 应 用 程序 全 局 内 存 的 大 小 。 


实例 总 内 存 (INSTANCE_MEMORY) 


实例 共享 内 存 


数据 库 B6 


数据 库 A 


数据 库 共享 内 存 


DATABASE MEMORY a) O T DATABASE MEMORY 
应 用 程序 全 局 内 存 ( ( 应 用 程序 全 局 内 存 
APPL MEMORY 


APPL MEMORY 
代理 私有 内 存 


数据 库 共享 内 存 


图 3-10 DB2 内 存 模型 
在 了 解 了 DB2 内 存 的 整体 结构 以 后 ， 接 下 来 分 别 谈 谈 这 些 内 存 区 域 的 具体 含义 。 
1. 实例 共享 内 存 


实例 共享 内 存 是 指 实例 级 的 通用 任务 所 需要 的 内 存 ， 比 如 数据 库 监 控 、 审 计 、 节 氮 〈 分 区 ) 
间 通 信 等 。 实 例 共 孚 内 存在 实例 局 动 时 分 配 , 在 实例 停止 时 释放 。 实例 共 于 内存 的 结构 如 图 3-11 


所 示 : 


实例 共享 内 存 


tris Eu Hed 
MON, HEAP. SZ 


RHET 
AUDIT_BUF_SZ 


快速 通信 管理 器 (FCM) 
FCM NUM BUFFERS 
FCM NUM CHANNELS 


E 3-11 DB2 实例 共享 内 存 图 


数据 库 监 控 扒 主要 用 于 一 些 监控 活动 ， 是 对 数据 库 捕 获 快 照 信 和 息 的 基础 ， 审 计 绥 人 存 用 于 有 
关 数 据 库 审 计 的 操作 ;快速 通信 管理 器 (FCM) 用 于 不 同 数据 库 节 点 《分 区 ) 之 间 的 通信 。 
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2. 数据 库 共享 内 存 

数据 库 共 享 内 存 是 指数 据 库 一 级 任务 所 需要 的 内 存单 元 ， 这 些 内 存单 元 被 数据 库 进程 共 
享 ， 用 来 满足 客户 请 求 。 这 些 内 存在 数据 库 被 激活 时 分 配 ， 在 数据 库 被 关闭 时 释放 。 数 据 库 共 
享 内 存 的 结构 如 图 3-12 所 示 。 


数据 库 共享 内 存 
DATABASE MEMORY 


UTIL HEAP. SZ DBHEAP 


T AEE 


数据 


库 堆 
?中 区 
RERET 
KEARE CATALOGCACHE SZ 


共享 排序 内 存 
SHEAPTHRES SHR 
EET 锁 表 SORTHEAP 
PCKCACHESZ LOCKLIST 
SORTHEAP 


图 3-12 DB2 数据 库 共 享 内 存 图 


从 图 3-12 可 以 看 到 数据 库 共 享 内 存 里 面 有 才干 区 域 ， 用 于 满足 数据 库 操 作 的 各 种 需求 ， 这 
些 内 存 区 域 的 大 小 基本 上 都 是 在 数据 库 配置 参数 (DB CFG) 中 设置 的 ， 下 面 分 别 进 行 解释 。 

(1) 实用 程序 堆 (UTIL HEAP SZ) 

为 实用 程序 提供 了 内 存 ， 比 如 备份 和 恢复 用 的 绥 冲 区 都 是 从 实用 程序 堆 里 和 面 分 配 的 ， 还 有 
LOAD 等 实用 程序 也 会 用 到 实用 程序 堆 。 

(2) 缓冲 池 (BUFFER POOL) 

用 来 缓存 数据 或 案 引 的 内 存 区 域 ， 是 人 磁 副 数 据 在 内 存 中 的 映射 ， 相 应 页 大 小 的 绥 冲 池 和 相 
应 页 大 小 的 表 空 间 对 应 ， 如 果 没 有 设置 相应 页 大 小 的 绥 冲 池 ，DB2 为 了 能 让 数据 库 局 动 不 受 影 
啊 ， 会 日 动 创建 几 个 不 同 页 大 小 的 默认 绥 冲 池 。 

数据 从 磁盘 到 缓冲 池 是 由 DB2 的 预 取 进程 (db2pfchr) 完成 的 。 如 果 db2agent 预见 到 SOL 
语句 需要 读 取 大 量 的 连续 数据 ， 可 以 在 真正 需要 数据 之 前 预先 从 磁盘 读 取 数据 。 

对 数据 的 修改 都 会 在 缓冲 池 里 进行 ， 而 页 面 清除 进程 《db2pclnr) 负责 把 修改 过 的 数据 页 
回 写 到 磁极。 清除 进程 一 般 是 在 特定 条 件 下 触 友 的 , 比如 缕 冲 池 里 的 修改 页 超过 一 定 百分比 (由 
CHNGPGS THRESH EAE) mue A v K bd vea d Hove Sk MA do Ha — xe ce EC EH 
SOFTMAX 参数 决定 ) 。 

(3) 数据 库 堆 (DBHEAP) 

主要 包括 日 志 绥 冲 区 和 编目 录 绥 存 。 日 志 绥 冲 区 用 于 日 志 读 写 ; 编目 录 绥 存 包 含 最 近 用 到 
的 数据 库 编目 录 信 息 ， 包 括 表 的 定义 、 统 计 信 息 和 权限 等 。 

(4) 包 绥 存 (PCKCACHESZ) 

保存 了 最 近 使 用 的 SQL 语句 或 者 存储 过 程 的 查询 计划 ,如 果 有 相同 的 查询 , 可 以 直接 从 包 
绥 存 中 获得 得 询 计划 ， 而 不 需要 重新 编 详 。 

(5) 锁 表 (LOCKLIST) 

保存 了 当前 所 有 锁 的 信息 。 
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(60 共享 排序 内 存 CSHEAPTHRES SHR) 

是 数据 库 进 行 排序 的 场所 ， 比 如 连接 等 操作 会 用 到 排序 内 存 。 如 采 排 序 内 存 不 够 用 ， 排 序 
会 放 到 磁盘 上 进行 ， 这 种 情况 被 称 作 排序 流出 ， 它 会 影 啊 排 序 的 效率 。 

在 DB2 中 与 共享 排序 内 存 相 关 的 参数 有 两 个 ， 一 个 参数 是 SORTHEAP， 它 规定 了 每 一 个 
排序 可 以 使 用 的 最 大 内 存量 。 另 一 个 是 SHEAPTHRES SHR， 它 规定 了 所 有 共享 排序 可 以 使 用 
的 总 内 存 的 软 限制 ， 当 共享 排序 内 存 接近 这 个 值 ， 数 据 库 将 会 减少 共享 排序 内 存 的 分 配 ， 当 共 
享 排 序 内 存 达 到 或 超过 这 个 值 , 则 数据 库 上 只 给 排序 分 配 最 少 的 内 存 让 其 能 够 完成 手头 上 的 工作 ， 
而 新 申请 的 排序 则 会 报 SQLO9SSC 错误 。 因 此 调整 SORTHEAP 的 同时 一 定 不 要 二 了 调整 
SHEAPTHRES SHR 的 大 小 。 

上 面 提 到 的 内 存 区 域 中 ， 组 冲 池 、 包 缓存 、 锁 表 以 及 排序 内 存 等 可 以 在 数据 库 共 享 内 存 的 
限制 下 ， 通 过 自 调 优 内 存 管理 (STMM) 互相 协调 ， 目 动 调节 大 小 ， 以 满足 数据 库 的 需要 。 关 
于 STMM， 将 在 3.4.4 节 具 体 讲 述 。 

3. 应 用 程序 全 局 内 存 

这 里 的 应 用 程序 全 局 内 存 并 不 是 外 部 应 用 程序 自己 的 内 存 ， 而 是 外 部 应 用 程序 连接 到 数据 
库 以 后 ， 数 据 库 为 了 处 理 这 些 应 用 程序 的 数据 请 求 而 分 配 的 内 存 ， 总 量 不 能 超过 
APPL MEMORY 的 限制 。 当 然 ， 也 可 以 把 APPL MEMORY 设 制 为 默认 值 AUTOMATIC, ix 
样 数据 库 可 以 自动 调整 。 应 用 程序 全 局 内 存 的 结构 如 网 3-13 所 示 。 


应 用 程序 全 局 内 存 
APPL_MEMORY 


应 用 程序 内 存 


应 用 程序 堆 
applheapsz 


统计 信息 堆 
stat heap sz 


语句 堆 


stmtheap 


图 3-13 DB2 应 用 程序 全 局 内 存 


下 面 对 其 进行 具体 介绍 。 

e 应 用 程序 堆 (applheapsz〉: 规定 了 所 有 应 用 程序 可 以 消耗 的 程序 堆 的 内 存 大 小 。 

e 统计 信息 堆 (stat heap sz): 为 运行 RUNSTATS 命令 提供 了 内 存 区 域 ， 用 来 收集 数据 
库 统 计 信 息 。 

e 语句 堆 Cstmtheap) : 为 SQL 语句 或 者 XQUERY 查询 语句 在 编译 时 提供 了 内 存 区 域 。 

4. 代理 私有 内 存 


每 个 DB2 代理 进程 都 需要 一 定 的 内 存 完成 其 工作 ， 比 如 构建 查询 计划 、 排 序 、 记 录 游 标 以 
及 收集 统计 信息 等 。 在 DB2 V9.1 和 之 前 版 本 中 , 代理 数量 的 上 限 由 maxappls 参数 和 maxagents 
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参数 的 较 小 者 决定 。 从 DB2 V9.5 开始 ，maxappls 默认 为 AUTOMATIC 并 日 maxagents 不 再 被 
使 用 ，DB2 可 以 根据 系统 工作 负载 和 资源 情况 来 决定 可 以 接受 的 最 大 应 用 程序 连接 数 ， 这 大 大 
人 稍 化 了 代理 私有 内 存 的 管理 。DB2 中 代理 私有 内 存 的 结构 如 网 3-14 rz. 


代理 私有 内 存 


ge JAVA 推 
AGENT STACK, SZ 私有 排序 内 存 JAVA HEAP SZ 
Sheapthres 为 非 0 值 


SORTHEAP dz hyo 
RQRIOBLK 


图 3-14 DB2 代理 内 存 图 


该 结构 中 各 种 内 存 区 域 的 具体 含义 如 下 。 
(1) 代理 栈 CAGENT STACK SZ) 
一 般 SQL 语句 越 复 杂 ， 代 理 栈 的 内 存 需 求 量 就 越 大 。 
(2) 私有 排序 内 存 (Sheapthres) 
sheapthres 是 个 实例 级 参数 ， 表 示 整 个 实例 范围 内 私有 排序 总 内 存 的 软 限 制 ， 如 采 私 有 排 
序 内 存 使 用 超过 这 个 限制 ， 则 新 请 求 的 私有 排序 内 存 分 配 会 大 幅 减少 。 如 果 sheapthres 被 设置 
为 0 值 ， 则 DB2 使 用 共享 排序 。 如 果 sheapthres 被 设置 为 非 0 值 ， 表 示 DB2 将 使 用 私有 排序 ， 
排序 内 存在 代理 中 分 配 ，SORTHEAP 参数 此 时 则 规定 了 每 个 私有 排序 最 多 使 用 的 内 存量 , IBM 
信息 中 心 的 推荐 是 将 sheapthres 设置 为 SORTHEAP 的 整数 倍 ， 至 少 为 实例 中 最 大 SORTHEAP 
值 的 2 倍 。 
SHEAPTHRES SHR 与 sheapthres 很 容易 混 请 ， 为 了 便于 大 家 记忆 ， 下 面 列 出 了 它们 两 者 
之 则 的 主要 区 列 : 
e SHEAPTHRES SHR 中 的 SHR 代表 Share, 表示 共享 内 存 的 限制 ， 而 sheapthres 代表 私 
有 内 存 有 的 限制 。 
e SHEAPTHRES SHR 是 数据 库 级 参数 ,代表 数据 库 范 围 的 共 圣 排序 内 存 限 制 ， 而 
sheapthres 是 实例 级 参数 ， 代 表 实 例 范 围 的 私有 排序 内 存 限 制 。 
e SHEAPTHRES SHR 与 sheapthres 是 锡 家 ， 如 条 sheapthres 7j 0, DB2 使 用 共 至 排序 ， 
SHEAPTHRES SHR 才 起 作用 ， 如 果 sheapthres 不 为 0，SHEAPTHRES SHR 基本 就 没 
用 了 ， 除 非 开 局 了 内 部 并 行 度 (ntra parallel 为 YES) 或 者 max connections 参数 的 值 
大 于 max coordagent， 这 时 会 使 用 共享 排序 。 
e SHEAPTHRES SHR 与 sheapthres 都 是 可 以 在 线 调 整 的 ， 但 sheapthres 在 从 0 调 到 非 
0 值 时 需要 重新 局 动 实例 才能 生效 。 
(3) JAVA XE (JAVA HEAP SZ) 
与 JAVA 相关 的 内 存 。 
(4) 客户 端 VO 块 (RQRIOBLK) 
与 客户 端 之 间 进 行 通 信 的 内 存 区 域 。 
如 果 要 查看 当前 内 存 的 分 配 状 况 ， 可 以 使 用 db2mtrk 工具 ， 比 如 ， 如 果 想 看 实例 以 及 数据 
库 的 内 存 分 配 状 况 ， 可 以 使 用 “-i-d-v” 选 项 ， 下 面 是 一 个 有 具体 的 例子 。 
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[ele SETQGlo2 ~] şdb2mtrk =i =e =y 
Tracking Memory ons 2011/06/02 at 2234047 


Memory for INSTance 


Other Memory is of size 15466496 bytes 

FCMBP Heap is of size 851968 bytes 

Database Monitor Heap is of size 327680 bytes 
Total: 16646144 bytes 


Memory for database: LDE 
Backup/Restore/Urtil Heap is of size 65536 bytes 
Package Cache is of size 20840448 bytes 
Other Memory is of size 196608 bytes 
Catalog Cache Heap is of size 5439488 bytes 
Exe POL ecgo (1) s 6 enze 9998607204. wee 
Eyes PoolL Nes. Üswsueur S2!e jwuEtec wool) 3s od eubze 934909 Ij wies 
E misse Pool Bes swesuew 6s wmuxes pool) ss oc shze 999924 wies 
Buffer Pool Heap (System 8k buffer pool) is of size 458752 bytes 
Buffer Pool Heap (System 4k buffer pool) is of size 393216 bytes 
Shared Sort Heap is of size 1966080 bytes 
Lock Manager Heap is of size 33423360 bytes 
Database Heap is of size 73990144 bytes 
2 
Application Heap (55) is of size 393216 bytes 
mos ecetiom Bes C54)-xs or exce 13232072 sse 
Applrcattion Heap (53) ts of size 65536 bytes 
Application Heap 52) s OR se 9559605 ytes 
Application cHeap C50) Us of o suczes655960 bytes 
AppiwcatuoneHeapc 5T) US OR suqu2e0955536 bytes 
a Bieego (C40 xs OW cubus $9390 I] 596 
Aoo eoero aa Beso (49) xs ou euze 695930 I9 596 
Aoo oaao Bieego (409). Xs ox eue 3927990 lowest 
A eee a Biecgo C206) sp oue uibus 99999 I9 ES 
ee 
A eae a ea a a e 
"m B ig 
Applications Shared Heap is of size 1245184 bytes 
Total; 1113655240 OYTES 


34.2 ”缓冲 池 设计 

图 3-15 所 示 为 DB2 组 神 池 的 工作 机 制 ， 主 要 包括 两 种 类 型 的 缓冲 池 ， 基 于 页 的 缓冲 池 和 
ATE. 

第 一 种 ， 基 于 页 的 缓冲 地 ， 这 是 默认 方式 。 绥 神 季 为 数据 库 页 提供 工作 内 存 和 高 速 缓存 ， 
当 应 用 程序 访问 表 行 时 ， 数 据 库 壳 理 喜 将 在 绥 神 池 中 得 找 包 侣 该 行 的 页 。 如 朱 在 绥 神 池 中 找 个 
到 该 页 ， 那 么 数据 库 管 理 堆 将 从 磁盘 中 该 取 该 页 并 将 其 放 入 缓冲 池 。 然 后 ， 可 以 使 用 该 数据 来 
处 理 碍 询 。 因 此 ， 数 据 库 管 理 霹 需要 从 磁盘 恋 取 或 写 入 人 厂 盘 的 次 数 越 少 ， 性 能 砚 越 好 。 

第 二 种 ， 基 于 块 的 绥 冲 池 。 基 于 块 的 缓冲 池 可 以 将 块 读 入 相 邻 的 内 存 区 而 不 古 将 它 分 霹 状 
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入 单独 的 页 ， 以 此 来 提高 预 取 操作 的 效率 。 每 个 缓冲 池 的 块 大 小 必须 相同 ,并 且 由 BLOCKSIZE 
参数 进行 控制 。 


Buffer Pool(s) AFANES] AFANES QD Prefetchers 
[| AA | 


CC» Page Cleaners 


N RAS 


图 3-15 DB2 缓冲 池 工 作 机 制 


G 注意 :; 基于 块 的 缓冲 池 适 用 场景 

对 于 连续 读 写 频繁 的 OLAP 查询 可 以 得 益 于 基于 块 的 缓冲 池 。 默 认 情 况 下 ， 所 有 组 

冲 池 都 是 基于 页 的 ， 这 意味 着 预 取 操作 将 把 磁盘 上 相 邻 的 页 放 入 到 不 相 邻 的 内 存 中 。 而 

如 果 采 用 基于 块 的 缓冲 池 ， 则 DB2 将 使 用 块 UO 一 次 将 多 个 页 读 入 缓冲 池 中 ， 这 样 可 以 
显著 提高 顺序 预 取 的 性 能 。 


可 以 使 用 CREATE BUFFERPOOL、DROP BUFFERPOOL 和 ALTER BUFFERPOOL 语句 
来 创建 、 删 除 和 修改 缓冲 池 。SYSCAT.BUFFERPOOLS 目录 视图 记录 定义 的 缓冲 池 人 信息。 下 而 
介绍 DB2 缓冲 池 设 计 中 需要 重点 关注 的 三 个 方面 。 

1. 为 缓冲 池 分 配 内 存 


对 于 64 位 系统 而 言 ， 缕 冲 池 的 大 小 没有 最 大 值 的 限制 ， 仪 受 限于 物理 内 存 的 大 小 。 缕 冲 池 越 
大 越 好 ， 但 是 ， 在 某 一 点 ， 当 命中 率 接近 100% 的 时 候 ， 再 增加 内 存 ， 对 提高 命中 率 收 效 甚 微 。 

对 于 OLTP 类 型 的 系统 ,一 开始 将 绥 冲 池 的 初始 值 设 为 50% 的 可 用 内 存 ， 然 后 再 根据 系统 实 
际 运行 情况 进行 调整 。 

对 于 OLAP/DSS 类 型 的 系统 ， 可 以 将 60% 左 右 的 可 用 内 存 分 配给 缓冲 池 。 

2. 调整 缓冲 池 大 小 


(1) 创建 数据 库 时 ，DB2 会 日 动 创建 一 个 名 为 IBMDEFAULTBP 的 默认 缓冲 闻 ， 所 有 的 
KT n pd og A A. 

(2) 仅 当 SYSCAT.BUFFERPOOLS 中 NPAGES 值 为 一 1 时 ， 数 据 库 参数 BUFFPAGE 才 
会 决定 绥 冲 池 的 大 小 ; 否则 ，BUFFPAGE 参数 不 会 起 作用 ，DB2 会 用 NPAGES 参数 所 指定 的 
页 数 创建 绥 冲 池 。 

(3) 当 SELF TUNING MEM 参数 打开 时 ， 使 用 AUTOMATIC 选项 的 缓冲 池 将 目 动 调 市 
大 小 。 
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(4) 除了 DB2 默认 的 缓冲 池 IBMDEFAULTBP 外 ， 还 可 以 创建 自 定义 缓冲 池 。 
FEK CREATE BUFFERPOOL 语句 创建 页 大 小 为 4KB 的 缓冲 池 BP1: 


CREATE BUFFERPOOL "BPI" IMMEDIATE SIZE 1000 AUTOMATIC PAGESIZE 4 K 


可 以 用 ALTER. BUFFERPOOL 语句 将 缓冲 池 BP1 从 1000 个 页 面 增 加 到 2500 个 页 面 ， 其 
中 IMMEDIATE 表示 立即 生效 。 


ALTER BUFFERPOOL BPI IMMEDIATE SIZE 2500 
3. 配置 多 缓冲 池 


X SUE E ZEDPIBAH WU PEEW: 

(1) 数据 表 空 间 和 索引 表 空 间 使 用 不 同 的 绥 冲 池 ， 方 便 管理 和 提高 性 能 。 

(2) 针对 不 同 应 用 特点 量 映 定做 缓冲 池 。 

对 于 OLTP 应 用 ， 可 以 根据 业务 特点 使 用 多 个 缓冲 池 ， 以 便 长 时 间 缓 存 应 用 所 使 用 的 数据 
Ji; 对 于 OLAP 应 用 ， 建 议 采 用 大 的 缓冲 池 ， 以 利于 大 块 数据 顺序 读 取 。 

(3) 为 频繁 使 用 的 热 表 设立 单独 的 缓冲 池 。 

通常 一 个 数据 库 系 统 中 ， 都 会 有 许多 频 索 使 用 的 热 表 ， 如 果 这 些 表 的 数据 全 都 位 于 绥 冲 池 
中 ， 那 么 访问 起 来 束 非 常 快 。 现在 假设 有 一 个 大 表 和 这 些 热 表 共享 一 个 缓冲 池 ， 那 么 DB2 引擎 
处 理 针 对 这 个 大 表 的 查询 时 ， 很 可 能 将 这 些 热 表 的 数据 页 从 绥 冲 池 中 交换 出 去 ， 如 果 再 次 需要 
这 些 热 表 数据 时 就 必须 重新 从 磁盘 恋 取 。 上 所 以 ， 建 议 用 单独 的 缓冲 池 来 存储 这 些 热 表 数据 。 


3.4.3 ”缓冲 池 命 中 率 

一 个 表 空 间 只 能 与 一 个 缓冲 池 相 关联 ， 而 一 个 绥 冲 池 则 可 以 用 于 多 个 表 空 间 。 绥 冲 池 命 中 
率 用 来 描述 数据 库 管 理 器 不 需要 从 磁盘 装 入 页 〈 即 该 页 已 经 在 绥 冲 池 中 ) 就 能 处 理 页 请 求 的 百 
4 E. TAERE rp EI AX: 


(1 - (( 数 据 物 理 读 次 数 + 索引 物理 读 次 数 ) / (数据 逻辑 读 次 数 + €SDESRQEXSUR))) * 100% 


接 下 来 用 例子 说 明 一 下 上 面 公式 的 用 法 , 下面 的 内 容 是 缓冲 池 IBMDEFAULTBP 的 快照 信 
妃 ， 从 中 可 以 看 到 数据 物理 读 次 数 为 86， 索 引物 理 读 次 数 为 62， 数 据 逻 辑 读 次 数 为 194， 索 引 
多 辑 谈 次 数 为 106， 根 据 上 面 的 公式 ， 可 以 计算 出 绥 冲 池 IBMDEFAULTBP 的 命中 率 为 S1%。 


Bufferpool name — IBMDEFAULTBP 

Database name = DBONE 

Database path = /home/test/test/NODE0000/SQL00001/ 
Input database alias = DBONE 

Snapshot timestamp = 08/16/2010 143:163:468.753322 
Buffer pool data logical reads = 194 

Buffer pool data physical reads = 86 

Buffer pool temporary data logical reads = 0 

Buffer pool temporary data physical reads = 0 

Buffer pool data writes = 0 

Buffer pool index logical reads = 106 

Buffer pool index physical reads = 62 

Buffer pool temporary index logical reads = 0 
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从 实践 上 来 看 , 缓冲 池 的 命中 率 应 当 超 过 9596, 并 尽 可 能 接近 10096, 这 样 使 用 磁盘 VO 的 
频率 就 越 低 。 要 提 噩 绥 冲 池 命 中 率 ， 可 以 参考 下 而 这 些 方法 : 

(1) ARIEI BO REIS PI TF o 

(2) A Si^ ea IR] 4 MAAR, FRE, BATHERE EN 

(3) 根据 表 的 访问 热度 分 配 缓 冲 池 ， 即 冷 表 和 热 表 使 用 不 同 的 缓冲 池 。 这 样 可 以 减少 绥 
冲 池 和 磁盘 之 间 数 据 的 频繁 交换 。 


3.4.48 STMM 目 动 管理 内 存 


有 过 DB2 内 存 调 优 经 验 的 用 户 都 知道 , 如 条 依靠 人 力 进 行内 存 的 实时 调整 , 通 利 效 末 都 不 
会 太 好 。 

从 DB2 V9 开始 引入 了 一 种 新 的 内 存 管理 功能 ， 叫 做 上 自 调 优 内 存 管 理 CSTMMD ，STMM 
通过 监测 多 个 内 存 区 域 鸭 使 用 情况 来 目 动 调整 其 大 小 ， 它 特别 适合 在 数据 库 负 载 经 音 变 化 或 者 
系统 资源 状况 比较 复杂 的 场合 使 用 ， 从 而 大 大 简化 数据 库 管 理 员 的 工作 。 

例如 ， 如 果 排 序 操 作 需 要 更 多 的 内 存 ， 而 一 些 缓冲 池 又 有 多 余 的 内 存 ， 那 么 STMM 会 释放 
多 余 的 缓冲 池内 存 , 并 将 它 分 配给 排序 堆 。STMM 可 以 管理 DB2 实例 (INSTANCE MEMORY) 
和 数据 库 CDATABASE MEMORY) 级 别 的 内 存 ， 包 括 : 缓冲 池 、 包 缓存 、 锁 内 存 区 、 排 序 内 
存 区 和 数据 库 共 享 内 存 区 等 。 

STMM 对 内 存 的 调整 过 程 都 被 与 入 数据 库 分 析 日 六 中 〈db2diag.log) 和 STMM 上 日志 

(stmm.log) 。 

DB2 默认 在 单 分 区 环境 下 局 用 STMM, 在 多 分 区 环境 下 关闭 STMM。 如 果 不 需 要 在 单 分 区 

环境 下 局 用 STMM， 则 可 在 创建 数据 库 之 后 将 数据 库 配 置 参数 self tuning mem 设置 为 OFF: 


update db cfg for database < 数据 库 名 > using SELF TUNING MEM OFF 


当局 用 STMM 时 ， 人 至 少 需要 将 两 个 或 两 个 以 上 的 内 存 参 数 设 置 为 自动 CAutomatic? , 15 
则 尽管 SELF TUNNING MEM 设置 为 ON，STMM 也 是 没有 办 法 动态 调整 内 存 的 。 


小 问题 : STMM 能 调整 不 同 页 « N 


KRETA, AA DBR 会 自动 实现 不 同 页 面 大 小 的 内 存 转 化 。 


总 之 ，STMM 可 以 实时 检测 并 优化 DB2 的 内 存 使 用 情况 ， 包 括 应 用 、 实 例 、 数 据 库 等 ， 
这 样 大 大 减少 了 DBA 的 工作 量 。 
3.45 ”为 电信 公司 设计 缓冲 池 
在 实践 中 ，DBA 需要 根据 实际 情况 选择 合适 的 缓冲 池 大 小 。 此 外 ， 对 于 数据 库 中 许多 频繁 
使 用 的 热 表 ， 可 以 考虑 将 这 些 热 表 用 单独 的 表 空 间 存储 ， 并 设置 单独 的 缓冲 池 。 
针对 这 个 电信 公司 的 应 用 负载 特点 ， 我 们 做 了 如 下 的 缓冲 池 规 划 : 
(D 开启 STMM， 人 允许 DB2 可 以 自动 调整 内 存 大 小 。 
(2) 定义 缓冲 池 的 页 大 小 为 8KB， 与 表 空 间 页 面 大 小 相 匹 配 。 
(3) 针对 数据 和 索引 创建 不 同 的 缓冲 池 ， 避 免 彼 此 之 间 的 影响 ， 从 而 提高 性 能 。 
(4) 针对 数据 的 冷 热 程度 ， 定 义 不 同 的 缓冲 池 。 
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(5) 初始 时 使 用 50% 的 可 用 物理 内 存 用 作 绥 冲 池 ， 随 后 根据 系统 运行 情况 再 做 调整 。 数 据 
库 服 务 器 的 可 用 内 存 为 64GB， 预 先 分 配 32GB 内 存 供 缓冲 池 使 用 。 
最 终 ， 规 划 了 4 个 缓冲 池 ， 分 别 为 tsdbhis、tsdbcur、tsibhis 和 tsibcur， 它 们 的 页 大 小 都 是 
8KB， 并 使 用 STMM 内 存 目 调 优 ， 如 表 3-6 Bran. 


LY， 小 问题 ， 为 什么 不 同 缓冲 池 的 初 如 
读者 可 以 发 现 , tsdbcur 和 tsibcur 的 初始 化 大 小 都 比较 大 ,分 别 为 16GB 和 8GB， 主 要 
是 考虑 到 当前 数据 使 用 频繁 ， 所 以 缓冲 池 越 大 越 好 。tsdbhis 和 tsibhis 的 初始 化 大 小 就 
较 小 了 ， 这 是 由 于 历史 数据 平时 用 的 不 多 ， 万 一 真 的 有 大 表 查 询 需 要 大 的 缓冲 地 ， 也 
可 由 STMM 来 动态 调整 。 


X6 ”缓冲 池 规划 
ges 用 途 
tsdbhis 是 历史 冷 数据 
dbe SKB 当前 热 数据 
— 历史 冷 数 据 索 引 
Sa SKB 当前 热 数据 索引 


创建 缓冲 池 的 语句 如 下 : 


create bufferpool TSDBHIS immediate size 512000 pagesize 8 K; 
create bufferpool TSDBCUR immediate size 2048000 pagesize 8 K; 
create bufferpool TSIBHIS immediate size 2512000 pagesize 8 K; 
create bufferpool TSIBCUR immediate size 1024000 pagesize 8 K; 


高 质 量 物 理 设 计 最 住 实践 
3.5 BMH ui SEE 
在 写 这 本 书 之 前 ， 我 们 和 一 些 客户 方 的 资深 DBA 交流 过 ， 大 家 认为 所 谓 物 理 设 计 ， 就 是 
要 通过 调整 让 DB2 把 便 件 的 处 理 能 力 发 挥 出 来 ， 这 其 实说 出 了 本 质 。 按 照 这 个 思路 ， 本 章 讲 述 


了 让 DB2 发 挥 便 件 处 理 能 力 的 方方面面 , 包括 便 件 选 型 、 存 储 设计 、 表 空间 设计 和 内 存 设置 等 。 
为 了 进一步 方便 读者 ， 我 们 接 下 来 将 分 圣 物 理 设计 的 最 佳 实践 。 


3.5.1 硬件 配置 


天 于 使 件 的 配置 ， 请 参看 本 章 3.1 节 ， 这 里 不 再 但 述 ， 仅 做 总 结 如 下 : 
以 Power 系列 主机 为 例 ，1 个 Power 处 理 右 内 核对 应 8GB 内 存 的 配置 方案 可 以 满足 绝 大 多 
数 的 应 用 ; 采用 RAD 技术 的 存储 设备 中 , 1 个 Power 处 理 器 内 核 可 以 处 理 300~500GB 活动 数据 。 


3.5.2 ”存储 的 设计 配置 
对 于 一 个 数据 库 来 说 ， 需 要 规划 这 几 个 重要 的 存储 空间 ， 包 括 ， 实 例 目录 、 数 据 库 目录 、 
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数据 、 活 动 日 志 、 归 档 日 志 、 备 份 以 及 临时 数据 等 。 这 里 仅 分 享 数 年 来 总 结 的 最 佳 实践 。 

(1) 存储 的 性 能 取 雇 于 物理 磁盘 的 个 数 ， 优 先 考虑 伐 盘 的 个 数 而 不 是 容量 。 

2) 在 磁盘 个 数 有 限 的 情况 下 ， 建 议 将 数据 和 索引 都 路 越 所 有 物理 盘 ， 这 样 可 以 发 挥 多 
Eu] VO 并 行 处 理 能 力 。 但 从 维护 角度 讲 ， 在 建 表 时 仍 建议 为 数据 、 索 引 和 大 对 和 象 创建 独立 
的 表 空 间 。 

(3) 最 多 两 次 条 融化 ， 存 储 层 通过 RAID 实现 ， 操 作 系 统 层 通过 LVM 实现 ，DB2 通过 表 
空间 容器 实现 ， 建 议 在 存储 层 和 数据 库 层 走 条 禹 。 

(4) 选择 正确 的 RAID Kal, XF OLTP 事务 型 应 用 ， 以 随机 小 块 读 写 为 主 ， 可 以 考虑 选 
择 RAID 10; 对 OLAP 分 析 型 应 用 ， 以 连续 大 块 读 写 为 主 ， 可 以 考虑 选择 RAID 5。 

(5) 数据 和 日 志 应 放置 于 不 同 的 物理 盘 上 。 对 于 数据 ， 可 以 选择 RAID 5 或 者 RAID 10; 
对 于 活动 日 志 ， 由 于 写 操作 很 频繁 ， 而 且 对 安全 性 要 求 高 ， 可 考虑 选择 RAID 10. 

C60 存储 的 驱动 程序 尽 可 能 支持 多 路 径 IO， 它 支持 UO 子 系 统 的 负载 均衡 和 流量 控制 。 


3.5.3 ”数据库 参 数 初 始 化 选择 


数据 库 参 数 的 配置 是 非常 繁琐 的 工作 ， 如 果 存 在 相似 的 运行 良好 的 系统 ， 以 此 系统 的 配置 
参数 为 基础 ， 并 进行 逐步 调整 ， 可 以 达到 事半功倍 的 效 末 。 在 没有 类 似 系统 的 情况 下 ， 也 可 以 
使 用 DB2 的 配置 问 导 (AUTOCONFIGURE 命令 ) 对 系统 进行 初步 配置 后 ， 再 根据 数据 库 系 
统 的 自身 特性 进行 针对 性 调整 ， 以 达到 最 优 的 参数 配置 。 
在 参数 调整 的 过 程 中 ， 需 要 额外 注意 下 面 这 些 性 能 相关 的 参数 : 
e 参数 newlogpath 决定 事务 日 志 的 存放 位 置 ， 将 事务 日 志 放 置 在 专用 的 存储 设备 上 ， 避 
免 和 数据 IO 竞争 。 
e 参数 logbufsz 决定 事务 日 志 的 缓冲 大 小 。 通 常 默 认 值 太 小 ， 根 据 实际 情况 ， 将 值 设 置 
在 1000 个 页 以 上 可 以 获得 较 好 性 能 。 
e 参数 mincommit 可 以 让 DB2 实现 批量 处 理 多 个 提交 的 事务 。 对 于 特别 繁忙 的 OLTP 系 
统 ， 可 以 将 其 值 调 整 为 大 于 1， 例如 3， 这 样 可 以 实现 批量 提交 。 
e 参数 diagpath 用 于 指定 DB2 诊断 日 志 的 位 置 ， 强烈 建议 在 DPF 分 区 数据 库 中 ， 使 用 分 
区 的 本 地 路 径 ， 而 不 是 NEFS 路 径 。 
关于 DB2 其 他 参数 的 调整 ， 请 参考 本 书 第 7 草 7.1 市 的 相关 内 容 。 


3.5.4 ”内存 设置 管理 


DB2 的 内 存 目 动 调整 机 制 CSTMMO ， 可 以 动态 调整 数据 库 内 存 ， 对 于 多 数 系 统 而 言 ， 使 
用 STMM 能 够 取得 很 好 的 性 能 。 然 而 ， 对 于 DPF 分 区 环境 而 言 ， 使 用 STMM 要 格外 小 心 。 

在 DPF 分 区 环境 中 ， 如 果 各 分 区 中 数据 量 分 布 、 内 存 大 小 以 及 分 区 的 负载 都 基本 一 致 ， 
STMM 将 会 非常 有 效 ; 否则 就 需要 在 这 些 分 区 上 禁用 STMM。 例 如 STMM 应 该 在 编目 分 区 上 
禁用 。 


总 的 来 说 ， 不 建议 在 DPF 分 区 数据 库 中 启用 STMM. 
3.5.5” 表 空间 设计 省 理 
表 空间 的 设计 与 存储 设计 息息相关 ， 在 设计 存储 时 ， 应 该 为 后 来 的 表 空 间 设计 做 好 铺垫 
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总 的 来 说 ， 表 空间 的 设计 应 该 遵循 以 下 原则 : 
e 对 于 临时 表 空 间 ， 建 议 使 用 SMS; 其 他 数据 建议 使 用 DMS， 以 发 挥 性 能 优势 。 
e 对 DMS 表 空 的 容器 类 型 ， 建 议 使 用 文件 系统 ， 而 不 是 裸 设 备 。 
e 为 大 表 和 小 表单 独 分 配 独立 的 表 空 间 ;， 表 和 索引 分 配 不 同 的 表 空 间 。 
e d EIN ex I EHA FJ B) e a RI e 
e “EJE DMS 表 空 间 时 ， 如 果 存 储 的 是 普通 数据 ， 可 指定 NO FILE SYSTEM CACHING 
选项 ， 如 果 是 大 对 象 LOB 数据 ， 可 考虑 利用 文件 系统 缕 存 。 


3.6 ”小 结 


物理 设计 是 数据 库 系统 的 基石 ， 只 有 在 优秀 的 物理 设计 基础 上 才 可 能 搭建 出 一 个 高 性 能 的 
数据 库 系统 。 本 章 以 主机 、 存 储 等 方面 为 主线 ， 从 硬件 选 型 、 存 储 设计 、 表 空间 设计 、 内 存 的 
管理 与 使 用 等 层面 逐个 进行 深入 地 讲解 和 分 析 ， 最 终 总 结 了 物理 设计 的 最 佳 实践 。 通 过 本 章 学 
习 ， 希 望 读者 能 够 全 面 、 深 刻 地 理解 数据 库 的 物理 设计 ， 并 能 将 设计 案例 活 学 活用 到 日 常 工作 
中 去 。 


r—— 
— ra 


ER 
经 上 典 逻 辑 设 计 


作为 一 名 IBM 原 厂 的 数据 库 顾 问 ， 笔 者 经 常人 参加 客户 、IBM 和 开发 商 的 工作 会 议 , 笔者 发 
现 大 部 分 与 会 人 员 也 包括 笔者 自己 常常 在 会 议 中 口 若 悬 河 。 但 是 ， 笔 者 记忆 犹 新 的 是 在 西安 参 
加 的 一 次 会 议 上 ， 有 一 家 来 自 兰 州 的 开发 商 ， 他 们 的 人 员 包 括 公 司 老 总 在 内 ， 却 保持 着 相当 的 
沉默 ， 透 露 着 一 丝 紧 张 和 青 涩 。 这 家 开发 商 并 不 大 ， 员 工 也 朴实 无 华 ， 正 因为 这 样 ， 他 们 设计 
的 系统 ,开发 的 代码 也 体现 了 这 种 返 开 归真 的 风格 : 对 DB2 的 经 典 逻辑 设计 包括 表 设 计 和 索引 
设计 运用 很 见 功底 ， 编 写 的 代码 也 没有 大 公司 开发 的 那么 绚丽 多 彩 ， 但 是 扎实 可 靠 地 反映 了 业 
务 需求 和 性 能 需求 。 这 样 的 系统 才 是 一 个 契合 自 上 而 下 方法 学 的 系统 ， 就 像 一 只 具有 极 大 升值 
空间 的 潜力 股 ， 我 相信 如 果 将 来 运用 更 高 级 的 设计 技术 ， 运 行 在 更 好 的 硬件 平台 上 ， 在 运 维 阶 
段 一 定 能 表现 出 卓越 不 凡 的 性 能 。 

不 论 对 Oracle 还 是 DB2， 其 经 典 逻 辑 设 
计 的 精髓 就 是 灵活 运用 规范 化 理论 设计 表 , 并 
通过 各 种 表 连 接 技术 和 索引 技术 加 速 数据 的 
查询 与 处 理 。 本 章 将 重点 阐述 DB2 的 经 典 逻 
辑 设 计 , 先 从 业务 需求 和 性 能 需求 谈 起 ,然后 
解答 现场 中 遇 到 的 较 多 的 问题 : 如 何 设计 常规 
表 、 临 时 表 和 时 态 表 ? 如 何 设计 索引 ? 如 何 设 
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4.1. S338 EV T E TZ AN 


数据 库 的 前 期 设计 至 关 重 要 ， 它 决定 了 数据 库 的 基因 ， 也 决定 了 数据 库 后 期 运 维 成 本 。 我 
作为 “救火 ”队员 经 常 去 客户 现场 ， 见 过 很 多 数据 库 ， 一 些 数据 库 的 设计 不 合理 ， 导 致 在 运 维 
阶段 出 现 问题 时 分 析 和 解决 的 代价 非常 高 晶 。 

Ek 小 改 事 ， 扁 的 三 兄弟 谁 的 医术 更 高 朋 mmm 
— AGOEBDEEGÉ:S “你 家 兄弟 三 人 ， 都 精 于 医术 ， 谁 的 医术 最 好 呢 ?“ 

(0 ABE: “大 哥 最 佳 ， 二 哥 次 之 ， 我 最 差 。 

”文王 再 问 : “ 那 为 什么 你 最 出 名 呢 ? ” 

(00 扁 鹊 签 :“ 大 哥 治 病 于 病情 发 作 之 前 ,诊疗 前 后 无 甚 感觉 ， 一般人 不 知 他 事先 已 除 病因 ， 
所 以 他 名 气 全 无 二 哥 治 病 于 病情 初 起 之 时 ， 一 般 人 以 为 他 只 能 治 小 病 ， 所 以 他 的 名 
00 气 只 及 本 乡 ; 我 是 治 病 于 病情 严重 之 时 ， 人 们 都 看 到 我 在 经 脉 上 下 针 放 血 、 用 药 教 药 ， 


都 以 为 我 医术 高 明 ， 因 此 名 气 响 遍 全 国 。” 
我 一 直 很 喜欢 这 段 话 ， 也 一 直 在 思考 扁 鹊 的 话 。 起 死 回 生 、 妙 手 回春 固然 高 明 ， 高 瞻 
远 瞩 、 未 雨 绸 引 才 是 真正 的 高 手 。 类 似 的 ， 发 生火 灾 时 ， 消 防 队 员 的 工作 当然 重要 。 
可 是 要 是 监察 队 工作 到 位 就 不 会 有 火 突 了 。 反 过 来 ， 如 果 建 筑 物 的 设计 本 身 存在 缺陷 ， 
出 现 火 灾 时 ， 消 防 队 员 也 只 能 望 洋 兴 叹 ， 


4.1.1 业务 需求 


业务 需求 是 逻辑 设计 需要 满足 的 首要 目标 。 这 也 许 是 老生 常 谈 了 ， 但 实际 上 ， 很 多 设计 人 
员 在 项 目 紧张 时 仅 重 视 应 用 的 功能 , 却 忽视 了 表 和 索引 的 设计 质量 : 很 多 时 候 在 设计 表 的 时 候 ， 
竟然 没有 主键 ， 没 有 索引 ， 也 没有 为 它 指定 表 空 间 。 出 现 这 种 情况 的 原因 在 于 ， 缺 乏 数据 库 设 
计 经 验 ， 另 外 通常 项 目 都 很 紧 ， 要 赶 工 期 ， 所 以 表 和 索引 的 设计 质量 就 没有 放 在 重要 位 置 上 了 。 
等 到 系统 上 线 后 慢 慢 出 现 各 种 问题 ， 这 时 再 想来 调整 表 的 结构 就 不 是 那么 容易 的 了 。 

在 数据 建 模 时 ， 必 须 明 确 业 务 需 求 ， 确 保 数据 中 实地 、 一 致 地 反应 业务 活动 ， 这 关系 到 数 
据 库 模型 的 质量 ， 所 以 恨 好 的 模型 和 数据 库 设 计 是 高 质量 应 用 系统 的 重要 基础 。 

我 曾经 过 到 一 个 用 户 抱 候 说 : “DB2 KIT, Æ DB2 中 建 一 个 含有 300 多 个 VARCHAR 
(400 字段 的 表 都 不 行 。” 我 当时 昕 了 后 非常 震惊 ， 到 属 是 怎样 特殊 的 应 用 才 和 需要 有 这 样 特 殊 
的 表 ? 我 相信 有 这 样 特殊 的 应 用 ， 但 是 否 真正 考虑 过 下 面 的 建议 : 

e 对 应 用 的 业务 需求 是 否 有 深刻 的 了 解 ， 对 业务 需求 的 抽象 程度 是 否 恰当 ? 

e 300 £^* VARCHAR (40) 字段 的 数据 长 度 是 否 过 于 草率 ? 

e 对 这 种 特殊 的 表 是 否 进行 了 正确 的 规范 化 ? 


4.1.2 性 能 需求 


如 今 ， 很 多 企业 圾 要 处 理 的 数据 量 都 在 爆炸 式 增长 ， 信 和 忠 系 统 仪 仅 做 到 功能 正确 是 远 远 不 
够 的 ， 还 必须 足够 快 。 作 为 信息 系统 基石 的 数据 库 ， 它 的 性 能 公关 重要 。 但 是 ， 大 多 数 人 仪 关 
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注 业 务 需 求 ， 数 据 库 性 能 不 是 他 们 关注 的 重点 ， 等 系统 上 线 后 性 能 调 优 应 该 交 给 资深 DBA 去 
摆 和 青 ， 他 们 调整 几 个 “有 麻 力 ”的 数据 库 参 数 ， 于 是 性 能 束 提 高 了 。 如 果 还 是 不 够 快 ， 就 该 升 
级 便 件 了 。 

设计 时 总 想 着 “ 先 把 系统 摘出 来 ， 之 后 再 让 专家 在 生产 环境 下 调 优 ”是 错误 的 ， 性 能 专家 
不 是 魔法 师 ， 性 能 调 优 也 不 是 万 能 的 ， 因 为 调 优 往往 不 能 修改 应 用 程序 和 系统 结构 ， 而 且 有 时 
候 性 能 调 优 并 不 能 从 根本 上 解决 性 能 问题 ， 甚 至 会 带 来 新 的 问题 。 

性 能 调 优 真正 能 做 的 主要 包括 两 个 方面 : 一 方面 , 调 优 系统 整体 性 能 , 主要 是 根据 当前 CPU 
能 力 、 可 用 内 存 、IO 子 系统 的 资源 情况 来 设置 相应 参数 。 另 一 方面 ， 针 对 有 具体 查询 的 调 优 ， 比 
如 增加 或 纠正 索引 方案 ， 为 复杂 得 询 创 建 MQT 等 。 

总 之 ， 性 能 问题 的 菲 魁 祸首 ， 通 常 是 不 合理 的 设计 。 这 就 要 求 在 设计 数据 库 时 就 开始 考虑 
性 能 ， 真 正 按照 自 上 而 下 方法 学 的 要 求 指导 设计 工作 ， 后 续 的 调 优 上 只 是 一 种 必要 的 补充 手段 。 


4.2. SEX XE VE UNI ELI)X 


应 用 的 数据 模型 设计 以 及 数据 的 增删 改 备 ， 都 围 经 表 进 行 ， 表 设计 是 数据 库 设 计 中 最 重要 
的 部 分 ， 也 最 能 体现 真 功夫 。 


4.2.1 ”规范 化 决定 成 败 


优 民 的 数据 库 ， 一 定 是 恰当 的 数据 ， 在 恰当 的 时 刻 被 分 到 恰当 的 表 中 。 

规范 化 为 何如 此 重要 ?” 答案 在 于 : 规范 化 使 混乱 变 得 有 序 。 成 功 的 数据 建 模 应 严格 性 守 基 
本 的 设计 原则 。 妆 我 在 大 学 里 学 习 数 据 库 课 程 的 时 候 ， 仪 仅 为 了 应 付 沽 试 ， 死 记 价 背 规 施 化 这 
种 枯燥 、 沉 闷 的 东西 。 多 年 以 后 ， 有 了 一 些 数据 库 方面 的 使 用 经 验 ， 我 才 认 识 到 规范 化 的 重要 
性 ， 才 认识 到 Codd 的 厉害 之 处 。 

E. F. Codd 为 表 有 的 设计 制定 了 游戏 规则 一 一 范式 (Normal Forms) ， 这 为 数据 库 迪 辑 设计 指 
明了 方向 。 规 范 化 的 表 ， 既 方便 对 数据 的 存 取 操作 ， 也 会 显著 简化 应 用 程序 的 事务 处 理 、 答 询 、 
报表 等 。 

规范 化 的 目的 在 于 : 

e 消除 见 余 数据 ， 例 如 避免 在 多 个 表 中 存储 相同 的 数据 。 

e 强制 数据 之 间 的 依赖 关系 ， 并 把 数据 拆 分 到 多 个 相关 表 中 。 

e 为 数据 增长 近代 最 大 灵活 性 。 

在 数据 库 设 计 中 ， 第 三 范式 (3NF) 是 最 重要 、 运 用 最 广泛 有 的 设计 范式 ， 第 三 范式 规定 : 

e 原子 性 : 表 的 每 个 字段 不 可 拆 分 。 

e 唯一 键 : 表 内 的 每 一 行 都 应 该 被 唯一 的 标识 ， 即 有 主键 。 

e Jv: 表 内 的 非 键 字段 相互 独立 ， 非 键 字 段 仅 依赖 于 主键 。 

非 规范 化 的 设计 可 能 市 来 数据 见 余 ， 甚 至 导致 数据 的 不 一 致 性 ， 进 而 导致 复杂 的 数据 输入 
控制 代码 、 拙 汐 的 性 能 、 模 型 无 法 演进 等 问题 。 不 过 ， 有 时 候 为 了 提 高 性能， 在 好 辑 设 计 中 也 
可 以 考虑 反 规 范 化 Cde-normalize) 。 反 规范 化 的 意思 是 , 打破 该 表 之 前 困 从 的 一 种 或 多 种 郊 式 ， 
利用 空间 换 时 间 来 提高 性 能 。 
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有 反 规范 化 最 常见 的 技术 是 重新 连接 表 来 避免 过 多 的 表 连 接 操 作 。 通 常 ， 规 范 化 过 程 要 求 将 
相关 的 信息 放 入 不 同 的 表 中 ， 应 用 查询 时 需要 通过 多 表 连 接 得 到 结果 ， 但 是 多 表 连 接 操作 需要 
消耗 系统 资源 和 时 间 。 所 以 , 反 规 范 化 的 建议 是 不 用 严格 按照 第 三 犯 式 将 数据 拆 分 到 不 同 表 中 ， 
而 是 允许 数据 有 见 余 ， 这 样 可 以 减少 表 连 接 的 个 数 ， 从 而 提高 性 能 。 

Fifa f B] zn Y 38 WU AR E ERHS c TS HAN, REQ SUM 表示 操作 的 金额 , PROD PR 
为 所 买 产品 的 价格 , PROD_CNT 为 所 买 产品 的 数量 。REQ_SUM 是 元 余 字 段 , 可 以 由 PROD PR 
FLI PROD CNT 得 到 ， 这 表明 该 表 的 设计 不 满足 第 三 范式 。 但 是 ， 增 加 REQ SUM 这 个 见 余 
字段 ， 可 以 提高 查询 速度 ， 这 就 是 以 空间 换 时 间 的 做 法 。 


Column Type Type 

name schema name Length Scale Nulls 
REQ ID od fox TE e INTEGER 4 0 No 

USER ID SYSIBM VARCHAR 48 0 No 
PROD ID SYSIBM VARCHAR 48 0 No 
PROD_PR SYSIBM VARCHAR 48 0 No 
PROD_CNT SYSIBM VARCHAR 48 0 No 

REQ SUM SYSIBM VARCHAR 48 0 No 


比较 : ASEE FA AST, 


XT LAG RONLiLA6. AüE—BNMEbSo:e. RRRA SE, REIA. REA T AEH 
范 化 ， 束 手 束 脚 ， 使 系统 性 能 不 合理 地 下 降 ， 该 采用 反 规 范 化 的 地 方 就 大 胆 采用 。 


4.2.2 用户 与 模式 


数据 库 中 的 每 一 个 对 象 (包括 表 、 索 引 和 视图 等 ) 都 有 了 唯一 的 名 字 ， 名 字 由 模式 名 (schema) 
加 上 对 象 名 构成 ， 即 模式 名 .对 象 名 。 这 就 如 一 个 人 的 姓名 ， 模 式 名 相当 于 “ 姓 ”， 而 对 象 名 相当 
于 “名 ”。 重 名 的 情况 下 ， 比 如 “ 李 小 明 ”与 “ 刘 小 明 ”， 可 以 通过 “ 姓 ” 将 这 两 个 人 区 分 开 。 

模式 有 两 个 作用 : 

CG) 对 数据 库 对 象 进 行 逻辑 分 组 ， 即 用 模式 对 不 用 应 用 的 表 进 行 分 组 。 比 如 在 一 个 综合 
性 的 数据 库 中 ， 可 以 将 财务 相关 的 表 放 在 一 个 模式 下 ， 人 力 资源 相关 的 表 放 在 另 一 个 模式 下 。 

(2) 在 多 用 户 的 情况 下 ， 避 免 不 同 用 户 使 用 相同 对 象 名 产生 的 神 突 。 比 如 ，A 用 户 创 建 了 
Xx TI, B 用 户 也 想 用 TI 作为 表 名 ， 有 了 模式 后 ， 这 个 问题 就 解决 了 。 

模式 在 运 维和 数据 迁移 中 也 有 各 种 方便 之 处 。 例 如 ，db2look 和 db2move 等 工具 可 以 限定 只 
操作 某 模式 下 的 所 有 对 象 。 


比较 : Oracle 和 DB2 模式 的 区 别 


Oracle 的 模式 名 就 是 用 户 名 , 但 是 DB2 中 的 模式 名 不 一 定 是 用 户 名 , DB2 的 模式 可 以 是 用 
户 名 ， 也 可 以 是 用 户 新 创建 的 模式 。 田 外 ，Oracle 可 以 创建 数据 库 用 户 ，DB2 只 能 使 用 操作 系 
AH. 
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DB2 文 持 两 种 方式 来 创建 模式 : 
(OD 显示 创建 : 通过 CREATE SCHEMA 命令 创建 ， 例 如 下 面 创建 模式 tpch. 


db2inst1@db2ring:->db2 "create Schema tpch" 
DB20000I The SQL command completed successfully. 


(2) EACE: 在 创建 对 象 时 指定 模式 ， 如 采 以 前 没有 创建 ， 那 么 在 创建 对 象 时 DB2 会 
目 动 创建 (当然 需要 有 相应 的 权限 ) ， 例 如 下 面 创 建 表 tl 时 ， 指 定 模式 bcp, HT bcp 以 前 没 
有 创建 过 ， 所 以 会 目 动 创建 。 


cdo2insti@Odobo2 ne el Vereate table bep. enn 
DB20000I The SQL command completed successfully. 


那么 如 何 使 用 模式 呢 ? 有 以 下 儿 种 场景 : 
G) 用 户 连接 数据 库 后 ， 如 条 SQL 语句 引用 表 时 没有 指定 模式 ， 那 么 默认 模式 就 是 用 户 
的 ID， 如 下 和 面 对 表 TI 的 碍 询 就 没有 提供 模式 名 ， 上 所 以 使 用 默认 模 陈 。 


do2instildoi2ring:/hnome/do2instil>dob2 "select * from ci" 


2 record(s) selected. 


(2) 可 以 显 式 用 “模式 名 . 表 名 ”来 引用 表 ， 如 下 例 中 的 tpeds.store sales. 


cloz insti@doz2 rings: =>0o2 "select count (*) from tpceads.store See" 
10000000 
| record(s) selected., 
(3) 可 以 用 SET CURRENT SCHEMA schema name， 来 修改 当前 会 话 中 的 默认 模式 。 


dob2insti@do2rings: /home/db2insti>dob2 set current schema eas 
DB20000I The SQL command completed successfully. 


db2instlG8db2ring:/home/db2instl»db2 "select count(*) from store sales" 
10000000 


1 record(s) selected. 


创建 好 模式 后 , 也 可 以 用 list tables for schema <schema name> £t Epi F RRI AS] EE, 
例如 下 和 面 查看 模式 tpcds 下 面 的 所 有 表 。 


co sene OLO ring: olc listr tables for schema els 


Table/View Schema Type Creation time 
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GU Sp OTT TPCDS T 2012=07=28=09.06.12.515337 
CUSTOMER ADDRESS DS T 2012=07=28=09.06.02.438131 
CUSTOMER DEMOGRAPHICS EDLS T 2012=07=28=09.06.04.398424 
DATE DIM IUE UD T 2012=07=28=09.06.04.807513 
HOUSEHOLD DEMOGRAPHICS BCDS T 2012=07=28=09.06.13.200210 
INCOME BAND TPCDS T 2012=07=28=09.06.09,.492320 
ITEM TBCDS T 2012=07=28=09.06.-09.813721 
PROMOTION UE CIS T 2012=07=28=09.06.13.7605332 
STORE TPCDS T 2012=07=28-09.06.11.-022605 
STORE SALES TPCDS T 2012=07=28=09.06.14.407324 
TIME DIM TPCDS T 2012=-07=286=09.06.- 089-247387 


除了 用 户 目 定义 模式 外 ， 还 有 一 些 系 统 模式 是 供 DB2 内 部 使 用 的 ， 主 要 有 以 下 几 个 组 : 
(1) SYSIBM 模式 下 的 对 象 存储 编目 信息 ， 即 类 似 Oracle 中 的 数据 字典 。 

(2) SYSCAT 模式 下 的 对 象 是 系统 编目 视图 ， 通 过 它们 可 以 查询 数据 库 对 象 的 各 种 信息 。 
(3) SYSSTAT 是 统计 视图 模式 ， 为 DB2 优化 器 提供 统计 信息 。 

(4) SYSIBMADM 是 系统 管理 视图 模式 ，DB2 V9 引入 ， 用 于 监控 和 管理 数据 库 。 


4.2. ”字段 与 类 型 


在 设计 表 结 构 时 ， 选 择 合 适 的 数据 类 型 非常 重要 ， 这 不 仅 直 接 影响 存储 的 空间 占用 ， 而 且 
关系 到 性 能 。 

首先 需要 搞 清 楚 DB2 提供 的 内 置 类 型 系统 ， 它 是 DB2 的 基础 ， 本 小 节 将 用 与 Oracle X} kk 
的 方式 ， 讲 述 它 们 之 间 的 区 别 。 

DB2 的 内 置 数 据 类 型 分 为 三 类 : 

e 数值 类 型 

e 字符 类 型 

e 日 期 类 型 

如 图 4-1 所 示 ， 列 出 了 DB2 的 三 类 内 置 数据 类 型 ， 其 中 字符 类 型 是 广义 的 ， 从 横 癌 上 看 ， 它 

含 单字 节 字 符 、 双 字 节 字符 、 二 进 制 数据 和 XML， 从 纵向 上 看 ， 它 包含 定 长 字符 类 型 、 变 长 

符 类 型 、 长 字符 类 型 和 大 对 象 LOB (Large Object) 。 接 下 来 ， 我 们 具体 讲 一 下 这 三 种 类 型 


人 Eo 


图 4-1 DB2 类 型 系统 
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1. 数值 类 型 


DB2 的 数值 类 型 是 多 样 化 的 。 表 4-1 列 出 了 DB2 的 数值 类 型 ， 并 给 出 了 对 应 的 Oracle 数 
352577 Number。 当 然 ， 这 种 对 应 只 是 表现 形式 上 的 ， 两 者 内 部 的 存储 格式 大 相 径 星 。 


表 4-1 DB2 数值 类 型 与 Oracle 比较 


DB2 数据 类 型 Oracle 数据 类 型 


SMALLINT 小 整 型 ，2 字 节 ， 十 进 制 精度 为 $ 位 ， 范 围 -32,768 | Number(5) 
到 +32,767 


INT( 或 INTEGER) 整 型 ，4 FE, PREN 10 f£. YO H|| Number(10) 
-2,147,483,648 到 2,147,483,647 
BIGINT KEW, S. TERREN I 位 Number(19) 
FLOAT(n) X n 在 1 一 24 时 为 单 精 度 浮 点 数 (4 T), PP n | Number 
在 25—53 时 为 双 精 度 浮 点 数 C8 F) ， 默 认为 双 
精度 
REAL 单 精 度 浮 点 数 ， 等 价 于 Float (24) Number 
DOUBLE 双 精 上 度 浮 点 数 ， 等 价 于 Float (53) Number 
DECIMAL(p,s) 十 进 制 类 型 ，p 表示 总 位 数 ，s 表示 小 数 点 后 的 位 数 | NUMBER(p.s) 


NUMBERIC DECIMAL 的 同义词 NUMBER 


DECFLOAT(16/34) DB2 V9.5 引入 的 十 进 制 浮 点 数 ，IEEE ERE, 精度 为 | NUMBER 


16 或 者 34， 默 认为 34 


如 表 4-2 所 示 , DB2 和 Oracle 的 字符 类 型 基本 上 能 对 应 起 来 。 另 外 , 再 提供 几 点 特别 建议 ， 
供 读者 参考 。 

CD 除了 二 进 制 大 对 象 ， 可 以 将 FOR BIT DATA 子 句 用 在 CHAR, VARCHAR 和 LONG 
VARCHAR 上 ， 表 示 这 些 类 型 用 于 存储 二 进 制 数据 。 例 如 ，CHAR (16) FOR BIT DATA 可 用 
于 存储 16 ^re B m ms. 

(2) LONG 数据 次 型 已 经 不 推荐 使 用 了 ， 它 的 存储 长 度 与 VARCHAR 和 VARGRAHPIC 
差不多 , 但 是 LONG 数据 不 能 组 存在 缓冲 池 中 , 访问 时 需要 从 磁盘 中 直接 读 取 ,因此 性 能 较 差 。 

(3) DB2 的 XML 类 型 使 用 原生 的 pureXML 技术 ， 有 着 相对 较 好 的 性 能 。 


表 4-2 DB2 的 字符 类 型 与 Oracle 比较 
DB2 类 型 描述 Oracle 内 置 类 型 
CHAR(n) 定 长 字符 串 , n<=254, n 缺 省 为 1 | CHAR(n) 
VARCHAR(n) 变 长 字符 串 ，n<=32,672 VARCHAR(n) 或 VARCHAR2(n) 
GRAPHIC(n) EKATE E, n<=127 NCHAR 
VARGRAPHIC(n) ap KODUE BET. n«-16,336 NVARCHR2 


BLOB 二 进 制 大 对 象 ， 可 达 2GB BLOB 
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(EKR) 
DB2 类 型 Oracle 内 置 类 型 
CLOB 字符 大 对 象 ， 可 达 2GB CLOB 
DBCLOB 双 学 广 字 符 大 对 象 NCLOB 
LONG VARCHAR 长 学 符 串 对 象 ， 不 与 数据 行 存在 | LONG 


一 起 ， 存 储 为 独立 的 对 象 ， 大 小 
为 32700 


LONG VARGRAPHIC 长 双 字 节 字 符 串 对 象 ， 最 多 能 存 | LONG 
fi 16350 个 字符 


XML XML 数据 XMLType 


/A 注意: Oracle 的 VARCHAR: 类 型 
VARCHAR2 X Oracle 自 定义 的 一 个 非 工 业 标准 VARCHAR,;VARCHAR2 可 以 用 null 
代替 空 字 符 串 。 


3. 日 期 类 型 


如 表 4-3 所 示 ，DB2 提供 三 种 类 型 ; DATE、TIME 和 TIMESTAMP, P TIMESTAMP 
精确 到 毫秒 。Oracle 提供 两 种 基本 的 日 期 类 型 : DATE 和 TIMESTAMP, DATE 类 型 包含 日 期 
和 时 间 , 也 就 是 DB2 中 DATE 和 TIME 类 型 的 结合 体 , 其 默认 格式 为 2011-04-26 15.21.20。Oracle 
的 TIMESTAMP 类 型 的 最 高 精度 可 达到 纳 秒 级 ， 如 2011-04-26.15.21.20.000000， 默 认 精 度 和 
DB2 的 时 间 惟 类 型 一 样 。 从 DB2 V9.7 开始 ，TIMESTAMP 也 支持 可 选 的 精度 ， 最 大 可 为 12。 

除了 4-3 表 中 所 列 的 日 期 格式 外 ， 根据 实 际 需 要 ，Oracle 和 DB2 都 可 以 使 用 多 种 不 同 的 日 
期 格式 。 


表 4-3 DB2 的 日 期 类 型 与 Oracle 比较 
DB2 例子 对 应 Oracle 类 型 
DATE 2011-04-26 DATE 


TIME I4 $^, HH:MM:SS 15:21:20 
TIMESTAMP © H H Ir Zr Rb ERE 2011-04-26.15.21.20.000000 TIMESTAMP 


了 解 了 DB2HJ2SAS RS. PH x EREK E: 

(1) 用 直观 简短 的 编码 来 代 蔡 较 长 的 值 。 例 如 ， 可 以 用 M 和 下 分 别 表 示 男 和 女 ， 可 以 用 
OPN, CLS 和 SLP 分 别 表示 帐号 已 开局、 关闭 和 休眠 的 状态 ， 可 以 用 CN. US 和 JP. 分 别 表 示 
中 国 、 美 国 和 日 本 。 

(2) 在 DB2 中 ， 数 值 类 型 的 处 理性 能 比 学 符 类 型 要 咒 ， 因 此 尽量 选择 数值 类 型 。 当 然 ， 
这 需要 在 数据 库 中 用 相应 的 属性 来 描述 这 些 数值 的 属性 信息 。 

(3) 选择 整 型 其 型 时 ， 需 要 注意 类 型 的 表示 范围 ， 比 如 small int 的 取 值 上 限 是 32767， 如 
果 要 存储 超过 32767 的 值 ， 就 需要 使 用 INTEGER 类 型 。 如 果 需 要 存储 的 值 甚至 超过 BIGINT 
的 表示 范围 ， 可 以 使 用 DECIMAL (n,0) , n 为 十 进 制 的 位 数 。 
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(4) 浮 点 类 型 表示 的 数据 是 近似 值 ， 如 果 在 银行 金融 领域 需要 精确 的 计算 结果 ， 可 以 使 
用 DB2 V9.5 引入 的 DECFLOAT。 

(50 一 般 根据 字符 串 长 度 是 否定 长 来 选择 CHAR 和 VARCHAR， 需 要 注意 CHAR 的 最 大 
长 度 是 254。 对 于 长 度 变 化 比较 大 的 字符 类 型 ， 一 般 选 择 VARCHAR. 

(6) 对 于 LOB 和 XML， 可 以 有 选择 地 使 用 内 联 (inline) 方式 来 处 理 ， 这 样 较 小 的 LOB 
和 XML 将 与 关系 数据 存储 在 一 起 ， 并 能 了 预 取 到 缓冲 池 中 ， 可 以 提高 性 能 。 


4.2.4 建 表 的 讲究 


先 用 一 个 例子 来 说 明 , 如 下 所 示 , 一 共 创 建 了 ITEM. STORE, CUSTOMER 和 STORE SALES 
四 个 表 ， 这 些 表 的 主键 将 在 4.2.5 小 节 讲 述 。 


CREATE TABLE ee Ra 
"I ITEM SK" INTEGER NOT NULL , 
"I ITEM ID" CHAR(16) NOT NULL , 
IDEEN STARTED DAD 
S eae aD DATES DATE 
"I ITEM DESC" VARCHAR(200) , 
"I CURRENT PRICE" DECIMAL(7,2) , 
"I WHOLESALE COST" DECIMAL(7,2) , 
"I BRAND ID" INTEGER , 
"I BRAND" CHAR(50) , 
LE 
Li 
"TI CATEGORY ID" INTEGER , 
"I CATEGORY" CHAR(50) , 
"I MANUFACT ID" INTEGER , 
"I MANUFACT" CHAR(50) , 
ST vise HAR (DOO 
"I FORMULATION" CHAR(20) , 
so oo ES 
EUNTES CHARIO) 
"I CONTAINER" CHAR(10) , 
"I MANAGER ID" INTEGER , 
"I PRODUCT NAME" CHAR(50) ) 
EN 


CREATE TA TCD Tr 
"S STORE SK" INTEGER NOT NULL , 
"S STORE ID" CHAR(16) NOT NULL , 
MCA TD AT S DIE 
"S REC END DATE" DATE , 
"S CLOSED DATE SK" INTEGER , 
"S STORE NAME" VARCHAR(50) , 
"S NUMBER EMPLOYEES" INTEGER , 
"S FLOOR SPACE" INTEGER , 
"S HOURS" CHAR(20) , 
"S MANAGER" VARCHAR(40) , 
"S MARKET ID" INTEGER , 
"S GEOGRAPHY CLASS" VARCHAR(100) , 
"S MARKET DESC" VARCHAR(100) , 
"S MARKET MANAGER" VARCHAR(40) , 
"S DIVISION ID" INTEGER , 
"S DIVISION NAME" VARCHAR(50) , 
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"S COMPANY ID" INTEGER , 

"S COMPANY NAME" VARCHAR(50) , 

"S STREET NUMBER" VARCHAR(10) , 
"S STREET NAME" VARCHAR(60) , 

"S STREET TYPE" CHAR(15) , 

"S SUITE NUMBER" CHAR(10) , 
IST ARC O 

"S COUNTY" VARCHAR(30) , 

SEM STATE” CHAR(2) , 

"S ZIP" CHAR(10) , 

"S COUNTRY" VARCHAR(20) , 

"S GMT OFFSET" DECIMAL(5,2) , 

"S TAX PRECENTAGE" DECIMAL(5,2) ) 
TN VND 


CREATE TABLE "TPCDS  "."CUSTOMER" ( 
"C CUSTOMER SK" INTEGER NOT NULL , 
"C CUSTOMER ID" CHAR(16) NOT NULL , 
"C CURRENT CDEMO SK" INTEGER , 
"C CURRENT HDEMO SK" INTEGER , 
"C CURRENT ADDR SK" INTEGER , 
"C FIRST SHIPTO DATE SK" INTEGER , 
"C FIRST SALES DATE SK" INTEGER , 
"C SALUTATION" CHAR(10) , 
"C FIRST NAME" CHAR(20) , 
"C LAST NAME" CHAR(30) , 
"C PREFERRED CUST FLAG" CHAR(1) , 
"C BIRTH DAY" INTEGER , 
"C BIRTH MONTH" INTEGER , 
"C BIRTH YEAR" INTEGER , 
"C BIRTH COUNTRY" VARCHAR(20) , 
"C LOGIN" CHAR(13) , 
"C EMAIL ADDRESS" CHAR(50) , 
"C LAST REVIEW DATE" CHAR(10) ) 
wi. Cast a ae (HI aa en hes cel nox OLET e 


CREATRB TABLE "TPODS — "I"STORBE SATES" X 
"SS SOLD DATE SK" INTEGER , 
"SS SOLD TIME SK" INTEGER , 
"SS ITEM SK" INTEGER NOT NULL , 
"SS CUSTOMER SK" INTEGER , 
"SS CDEMO SK" INTEGER , 
"SS HDEMO SK" INTEGER , 
"SS ADDR SK" INTEGER , 
"SS _ STORE SK" INTEGER , 
"SS PROMO SK" INTEGER , 
"SS TICKET NUMBER" INTEGER NOT NULL , 
"SS QUANTITY" INTEGER , 
"SS WHOLESALE COST" DECIMAL(7,2) , 
teo ToT PRICEY DECIMALNI 2) 
"SS SALES PRICE" DECIMAL(7,2) , 
IUS e m OM 
LS ao T oA e e DECIA PNE 
re I CO TM 
noS Lr DH UD ESTA UP 
"US SURE mT DI MONEO EP 
"SS COUPON AMT" DECIMAL(7,2) , 
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SS 
nn 
SS RM 
COMPRESS YES 
ET RD DT 
(PART "PARTO" STARTING(MINVALUE) ENDING(2450814) IN "TS PD DATA 001" 
NE 
PART YEAR RU TARTI NCO 4s LIEST) ND Me 4 5 USC AIO TDI aa oo 
PART "PART3" STARTING(2451545) ENDING(2451910) IN "TS PD DATA 001" 
PART YEAR TANI DAEIPINGUSIqOT T ENDISNG(2452275) WNOTPRSQEPIDSEAPAS OT 
( De 
( ) ( ) 
( ) ( E 


, 


, 
, 
, 
, 
, 
, 


PART PARTS” STARTING P 
PART PARTO” STARTING(2452641) ENDING (2453005) IN “TS PD DATA 001" 
PART “PART/™ STARTING(2453006) ENDING (MAXVALUE) IN “TS PD DATA 001* ); 


这 个 例子 包含 丰 宇 的 内 容 , 可 以 作为 数据库 设计 时 建 表 的 典范 。 下 面 解读 一 下 其 中 的 妙 处 。 
1. 表 空 间 的 规划 


首先 需要 规划 好 表 衬 间 。 根 据 数 据 的 访问 特性 《数据 量 大 小 和 访问 频率 ) ， 规 划 不 同 的 表 
空间 ， 这 对 性 能 调 优 和 运 维 将 大 有 好 处 。 款 引 与 数据 一 般 分 开 存 储 在 不 同 的 表 空 间 。 那 么 ， 效 
据 帮 哪 个 表 空间 ， 索 引 放 哪个 表 空间 ， 热 表 数 据 放 哪 个 表 空 间 ， 大 表 数 据 放 在 哪个 表 空 间 ， 在 
建 表 前 就 需要 做 好 存储 规划 。 


G 注 意 : 每 条 记录 的 最 大 长 度 不 能 超过 页 大 
每 条 记录 的 最 大 长 度 不 能 超过 页 大 小 。 比 如 pagesize 为 8K 的 表 空 间 ， 记 录 的 最 大 
长 度 不 能 超过 8K。 如 果 表 中 需要 存储 3 AN VARCHAR (8K) 的 字段 ， 那 么 在 页 大 小 为 


16K 的 表 空 间 中 是 放 不 下 的 ， 必 须 放 在 32K 页 大 小 的 表 空 间 中 。 


在 这 个 例子 中 ， 大 表 STORE SALES. ITEM 和 CUSTOMER 的 数据 存放 在 表 空 间 
TS PD INDX 001 中 ， 而 索引 存储 在 表 空 间 TS PD INDX 001 中 。 表 STORE 的 数据 量 小 ， 访 
问 频 繁 ， 数 据 表 空间 和 索引 表 空 间 分 别 为 TS SM DATA 001 和 TS SM INDX 001， 可 以 为 之 
设置 足够 大 的 缓冲 池 ， 让 这 些 热 数据 常 驻 内 存 。 
如 果 表 中 有 大 对 象 数据 ， 还 应 该 用 long in 子 句 指定 存储 大 对 象 表 空间 。 
Aa 注意 : DB2 没有 用 户 级 别 的 默认 表 空间 
很 多 熟悉 Oracle 的 用 户 在 问 ，DB2 中 有 没有 机 制 为 某 个 用 户 (模式 ) 建 表 时 指定 默 


认 表 空间 。 答 全 是 没有 ! 


2. 有 意义 的 表 名 和 字段 名 


表 名 和 字段 名 在 实际 应 用 中 非常 重要 。 我 在 一 次 客户 支持 中 ,发 现 了 一 个 表 的 名 字 叫 hkjf， 
刚 开始 根本 不 知道 这 表 名 是 喻 意思 ， 后 来 间 了 客户 ， 客 户 才 告知 是 “航空 计 费 ”这 四 个 学 的 首 
字母 ! 对 这 种 表 名 ,没有 好 的 文档 和 备注 ， 很 难 猜 出 来 。 因 此 ， 建 议 要 起 有 意义 的 表 名 和 字段 
名 ， 并 在 项 目 中 采用 一 致 的 命名 规则 ， 这 样 更 容易 理解 。 

在 这 个 例子 中 ， 表 名 分 别 为 ITEM、CUSTOMER、STORE 和 STORE SALES， 读 者 一 看 就 
知道 它 的 作用 。 有 人 也 许 会 问 ， 为 什么 不 直接 用 SALES 代替 STORE SALES 作为 表 名 ? 这 是 
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因为 有 另 一 个 表 WEB SALES 存储 网 上 销售 数据 ， 而 用 STORE SALES 存储 实体 店 销 售 数据 。 
除了 表 名 ， 学 段 名 也 应 该 选择 有 意义 的 名 字 ， 这 里 总 结 一 下 上 例 中 的 几 个 可 以 借鉴 的 点 : 
C10 字段 名 能 显 而 多 见地 表明 存储 数据 的 含义 ， 例 如 ，I CURRENT PRICE 和 
SS SALES PRICE 等 。 
(20 由 于 SQL 语言 是 不 区 分 大 小 写 的 ， 多 个 单词 连 成 的 字段 名 可 以 用 下 划 线 “_ ”分 隔 。 
(3) 一 致 的 后 级 规范 ， 比 如 SK 或 者 ID 作为 键 的 标识 。 
(4) 一 致 的 字段 名 前 绥 ， 可 以 用 表 名 的 一 个 学 母 或 者 几 个 字母 作为 字段 名 前 组， 如 上 例 
L”? "C". *S "JW *SS ”。 这 种 做 法 对 SQL 语句 的 编写 大 有 好 处 ， 特 别 在 多 个 表 
做 连接 的 时 候 。 例 如 ， 使 用 字段 名 前 级 ， 下 和 面 这 条 SQL 语句 共有 非常 好 的 可 读 性 : 


select ayvyg(ss quantity) aggi, 
avg(ss_ list price) agg2, 
avg (ss Coupon amt) gr 
avg (ss _ sales price) agg4 
trom store sales, store, item 


We 
ss StOre sk = © store sk and 
$ state in ("SD"; "FPL"; YMI", "LAY, "MO"; "SC") 


group by i item id, § state 


LA, IFTE EMMAA, HATAREE RENA, ME H e 
WZH EKM BIN SUPE LU, EAKR SF. 
3. 所 使 用 到 的 CREATE TABLE 语句 选项 


CREATE TABLE 建 表 语句 的 选项 有 很 多 ， 这 里 介绍 上 面 用 到 的 两 种 : 
(1) COMPRESS: 压缩 选项 ， 月 用 压缩 可 以 节省 磁盘 空间 ， 并 可 以 提高 VO 性 能 和 缓存 
池 的 命中 率 。 如 上 例 中 对 STORE SALES XH COMPRESS YES 子 句 启用 压缩 ， 关 于 压缩 的 相 
关内 容 请 参考 第 su. 
2) 分 区 技术 : 上 例 中 的 STORE SALES 表 用 到 了 表 分 区 技术 ， 表 分 区 技术 将 在 第 5 章 
具体 前 述 。 
人 小 技巧 ， CREATE TABLE 其 他 重要 选 : 
€ APPEND ON: 表示 插入 时 直接 添加 到 表 的 最 后 。 对 于 高 并 发 的 OLTP 应 用 ， 对 
目标 表 启 用 APPEND ON 就 不 需要 在 插入 的 过 程 中 寻找 空闲 空间 了 ， 只 需要 将 
记录 加 到 表 的 末尾 即 可 ， 这 样 可 以 在 一 定 程度 上 提高 性 能 
© PCTFREE: 用 来 维护 磁盘 上 空闲 的 空间 ， 它 的 缺 省 值 是 10， 如 果 表 中 有 聚集 索 
引 并 且 有 大 量 的 插入 、 更 新 和 删除 操作 ， 则 该 值 可 以 调 高 到 20-35. 
€ VOLATILE: 表示 表 的 行 数 会 急剧 变化 ， 这 样 优化 器 不 用 考虑 表 的 统计 信息 ,会 
尽量 使 用 索引 扫描 ， 而 不 是 表 扫 描 。 


最 后 ， 建 表 完 成 后 可 以 通过 describe table 命令 得 看 表 的 学 段 和 数据 类 型 ， 下 面 是 得 看 表 
tpcds.customer 的 输出 结 


db2 => describe table tpcds.customer 
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Data type Column 

Column name schema Data type name Length Scale Nulls 
CG CUSTOMER SK E eT INTEGER 4 0 No 
C CUSTOMER ID SYSIBM CHARACTER 16 0 No 
C CURRENT CDEMO SK SMSEM INTEGER 4 0 Yes 
C CURRENT HDEMO SK SMSEM INTEGER 4 0 Yes 
C CURRENT ADDR SK SMSEM INTEGER 4 0 Yes 
C FIRST SHIPTO DATE SK SYSIBM INTEGER 4 0 Yes 
C FIRST SALES DATE SK SYSIBM INTEGER 4 0 Yes 
C SALUTATION SMSEM CHARACTER LO 0 Yes 
C ELIRST NAME SSAB M CHARACTER 20 0 Yes 
C LAST NAME SY STEM CHARACTER 30 0 Yes 
C PREFERRED CUST FLAG SAREM CHARACTER 1 0 Yes 
C BIRTH DAY SY Sd bM INTEGER 4 0 Yes 
C BIRTH MONTH S eI INTEGER 4 0 Yes 
C BIRTH YXBAR SYSIBM INTEGER 4 0 Yes 
C BIRTH COUNTRY SY od VARCHAR 20 0 Yes 
C LOGIN 5X9 LBM CHARACTER 13 0 Yes 
C EMAIL ADDRESS SY S9 CHARACTER 50 0 Yes 
C LAST REVIEW DATE SYSIBM CHARACTER 10 0 Yes 


4.2.5 S5 


KAR xe A n EE TEST er IH OKAT e P SOS PITE B xe. KWARA FA se RETE 
非常 重要 的 作用 ，DB2 文 持 的 表 约 束 有 以 下 几 种 : 

(1) 主键 约束 : 主键 也 是 一 种 唯一 性 约束 ， 是 保证 数据 完整 性 的 基础 。 一 般 来 说 ， 数 据 
库 的 表 都 应 该 有 主键 。 

(2) 外 键 约 束 : 定义 两 个 表 之 间 的 参照 完整 性 。 引 用 的 表 称 为 子 表 ， 补 引用 的 表 称 为 父 
表 。 子 表 上 引用 的 键 叫 外 键 ， 它 引用 父 表 上 的 主键 。 外 键 约 束 要 求 外 键 上 的 值 在 父 表 中 必须 存 
在 。 为 了 确保 数据 完整 性 ， 当 对 父 表 进 行 增删 改 等 操作 时 ， 需 要 对 子 表 进行 相应 的 处 理 ， 例 如 
级 联 删除 、 受 限 删除 、 置 空 值 等 。 

(3) JERAR: 限定 该 字段 的 值 不 能 为 空 CHI NULL 值 ) 。 

(4) 唯一 性 约束 : 要 求 表 上 这 些 字 段 的 值 必 须 唯一 ， 不 能 有 重复 。 

(5) 检查 约束 : 指定 字段 的 值 必须 在 检查 约束 的 范围 内 。 人 例如， 限定 订单 表 COrder) 的 
状态 〈status) 字段 只 能 有 五 个 值 : CR OÆ) 、PY (已 支付 ) 、DR (已 送 达 ) 、CN (取消 ) 
和 CO (关闭 ) 。 


1. 定义 合理 的 主键 和 外 键 
主键 是 必 不 可 少 的 ， 外 键 是 可 选 的 。 在 数据 库 复制 的 时 候 ， 也 需要 有 主键 ， 如 朱 没 有 主键 


会 影响 复制 的 性 能 。 表 的 主键 可 以 采用 系统 生成 的 唯一 值 ， 也 可 以 是 用 户 输入 ， 下 面 是 4.2.4 
节 用 到 的 表 TPCDS.ITEM 和 TPCDS.STORE SALES 的 主键 及 其 外 键 定 义 。 


ma ein IN 
ADD PRIMARY KEY 
(ar aem eje 


ALTER TABLE UTPODS "oDBIORE SALES" 
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ADD PRIMARY KEY 
(Ree PT eus 
"SS TICKET NUMBER"); 


ATDERODASDEONTPODS OU "STORE SALES” 

ADD CONSTRAINT "FK3A" FOREIGN KEY 
(uo TM 

REFERENCES "TPCDS  "."ITEM" 
(I TEM or") 

ON DELETE NO ACTION 

ON UPDATE NO ACTION 

NOT ENFORCED 

ENABLE QUERY OPTIMIZATION; 


2. 尽量 少 使 用 空 值 字段 


在 应 用 程序 中 ， 将 诸如 “C1 IS NOT NULL” 或 者 “C1 IS NULL” 这 种 条 件 拼 接 到 SQL 语 
名 中 ， 导 致 SQL 语句 复杂 难 读 ， 程序 代码 复杂 。 实 际 上 ， 如 果 一 个 表 的 字段 大 多 可 为 空 值 ， 这 
说 明 数 据 库 设 计 可 能 存在 缺陷 。 

因此 ， 建 议 尽 量 将 字段 定义 为 NOT NULL， 可 以 使 用 默认 值 代替 。 当 然 ， 空 值 的 存在 本 身 
也 有 它 的 价值 和 人 含义， 提倡 少 用 并 不 是 说 不 能 

下 面 用 一 个 例子 来 说 明 。 如 下 所 示 ,， 大 部 分 字段 都 是 NOT NULL, 只 有 CHANGEREASON 
和 NOTES 允许 空 值 ， 从 业务 角度 看 ， 这 两 个 字段 确实 需要 空 值 ， 应 该 说 这 是 一 个 对 空 值 属性 
处 理 较 好 的 表 设 计 。 


CREATE TABLE "DB2ADMIN"."BILLINGMETHOD" ( 
"ACTIVERECORD" CHAR(1) NOT NULL , 
“BILLINGMETHOD” CHAR(2) NOT NULL ; 
"CHANGEREASON" CHAR(4) , 
"DATAINTEGRITYINDICATOR" CHAR(1) NOT NULL , 
"DATETIMESTAMP" TIMESTAMP NOT NULL WITH DEFAULT CURRENT TIMESTAMP 
"DEBTORREFERENCENUMBER" CHAR(10) NOT NULL 
"ENDDATE" TIMESTAMP NOT NULL , 
"“"STARTDATE" TIMESTAMP NOT NUBE 
"NOTES" VARCHAR (1000) ， 
"BROGRAMIDENTIFIER" CHAR(10); NOT NULL ; 
"SERVICEPROVIDER"” CHAR(8) NOT NULL ; 
VUSERIDENTILIFPILIER”Y CHAR (10) NOT NULL ; 
"WORKSTATIONIDENTIFIER” CHAR (10) NOT NULL )ș 


, 


, 


MV MB B E x WIN Net HR ERES TER EGO PP HI BE2J A ELIT] 2003 2H. 26 D 
存在 属性 字段 中 ， 这 的 确 吉 免 了 空 值 的 出 现 。 但 是 这 种 设计 需要 读 取 数据 后 ， 在 SQL 或 者 应 用 
程序 中 进行 处 理 ， 比 如 用 substr 或 者 位 操作 来 处 理 数 据 。 所 以 ， 需 要 根据 具体 情况 权衡 处 理 。 

3. 显 式 声明 约束 


约束 有 助 于 控制 输入 值 的 范围 ， 有 助 于 保证 数据 完整 性 。 对 于 约束 规则 ， 应 该 在 数据 库 中 
显 式 声明 。 人 例如， 要求 数据 库 引 擎 对 字符 串 进 行 算术 处 理 时 一 一 当 定 义 了 字符 串 型 字段 来 存储 
数字 数据 ， 而 其 中 不 慎 包 含 非 数 学 字符 时 ， 驶 会 出 现 这 样 的 错误 。 
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在 数据 库 中 只 需 定 义 约束 一 次 ， 就 可 以 为 应 用 程序 使 用 ， 奋 则 束 必 须 由 应 用 程序 目 己 来 处 
理 了 ， 所 以 约束 在 数据 库 上 定义 比较 合适 。 
4.2.6 序列、 标识 列 和 生成 列 
本 方 探讨 序列 、 标 识 列 和 生成 列 这 三 个 最 容易 混 清 的 概念 ， 最 后 讲解 一 下 在 数据 迁移 中 需 
要 注意 的 地 方 。 
1. 序列 
序列 (Sequence) FERRY] (Identity Column) 都 能 目 动 生成 唯一 的 数值 序列 ， 这 些 唯 一 值 


往往 用 来 作为 数据 行 的 唯一 标识 。 序 列 和 标识 列 支 持 的 类 型 包括 SMALLINT, INTEGER , 
BIGINT 和 DECIMAL (n, 0) , 


比较 : 序列 和 标识 列 的 区 别 
e 标识 列 与 特定 的 表 绑 定 ， 而 且 每 个 表 最 多 只 能 
e 序列 是 独立 的 数据 库 对 象 ， 不 与 表 关 联 ， 通 过 
个 表 同 时 使 用 。 


定义 一 个 标识 列 。 
NEXTVAL 来 获取 下 一 个 值 ， 可 以 被 多 


序列 对 象 在 以 下 情况 下 很 有 用 : 

(1) 可 以 使 用 序列 来 生成 键 ， 用 以 路 多 个 表 协 调 各 键 ， 不 至 于 导致 混乱 。 既 简单 方便 ， 
又 便于 管理 。 

(2) 每 个 表 有 多 个 列 需 要 自动 生成 的 值 ， 可 以 通过 使 用 同一 个 序列 或 多 个 序列 为 每 一 行 
生成 多 个 值 。 

下 面 这 个 例子 创建 了 一 个 SEQUENCE 对 象 ， 它 被 用 来 为 两 个 表 的 唯一 列 提供 生成 值 。 

CREATE SEQUENCE DB2ADMIN.CHARGESEQ AS BIGINT 

START WITH 1 INCREMENT BY 1 


CACHE 10 
INELOL UOCE E 


INSERT INTO DBZADMIN - CHARGE WALTER VALUES (NEXT YAL FOR DBZADMIN o CHARGE SEQ; 205.8) 5 
INSERT INTODB2ADMIN.CHARGE ELECTRICVALUES (NEXT VALFORDB2ADMIN.CHARGE SEQ, 324.30); 


这 里 需要 提 的 是 与 性 能 相关 的 CACHE 选项 CACHE 10 表示 有 10 个 序列 值 缓存 在 内 存 中 ， 
而 第 11 个 值 则 存在 编目 表 中 。 缓存 序 列 值 当然 是 为 了 性 能 , 否则 每 次 取 下 一 个 值 都 需要 访问 编 
目 表 ， 这 对 高 负载 的 OLTP 应 用 可 能 带 来 影响 。 当 然 ， 如 果 系 统 骨 溃 ， 这 些 缓存 的 值 会 丢失 ， 
DB2 需要 从 编目 表 中 获取 下 一 个 值 。 因 此 ， 如 果 不 和 希望 由 于 这 种 情况 导致 不 连续 的 序列 值 ， 请 
用 NO CACHE 选择 。 


2. 标识 列 


先 来 看 标识 列 的 用 法 , 如 下 所 示 , 表 DB2ADMIN.REVENUE 上 定义 了 一 个 标识 列 REVNO, 
起 始 值 为 1000， 每 次 递增 1。 
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CREATE TABLE DB2ADMIN .REVENUE ( 
REVNO INTEGER GENERATED ALWAYS AS IDENTITY ( 
START WITH 1000 INCREMENT BY 1), 
AMOUNT DECIMAL (12,2)) 


事实 上 ， 标 识 列 有 两 种 生成 模式 : 

(1) GENERATED ALWAYS: 总 是 为 新 的 行 生 成 值 ， 不 允许 用 户 提供 显 式 的 值 。 

(2) GENERATED BY DEFAULT: 用 户 可 以 提供 显 式 的 值 ， 在 用 户 未 提供 值 时 ，DB2 会 
为 该 列 生 成 值 。 但 是 ， 这 就 没 法 保证 该 列 上 的 值 具有 唯一 性 ， 这 会 违背 标识 列 所 要 求 的 唯一 性 。 

下 面 的 例子 展示 了 GENERATED ALWAYS 模式 在 插入 数据 时 不 能 为 标识 列 显 式 提供 值 ， 
否则 会 抛 出 SQL0798N 的 错误 。 对 于 回 深 的 行 ， 生 成 值 也 随 之 抛弃 ， 在 下 一 次 插入 数据 时 将 生 


成 新 值 。 
INSERT INTO DB2ADMIN.REVENUE VALUES (DEFAULT, 1382.06 ) 5 一 一 一 > mA (1000, 1382.06) 
INSERT INTO DB2ADMIN.REVENUE (AMOUNT) VALUES (2384.96); 一 一 一 > 搬入 (1001. 2384.96) 
INSERT INTO DB2ADMIN.REVENUE VALUES (2000, 84927.00); ---» a SOLOT798N, 
(C ONMAIP 
INSERT INTO DB2ADMIN.REVENUE (AMOUNT) VALUES (879.23); 一 一 一 > 插入 41002 979.23) 
RONDELO 
INSERT INTO DB2ADMIN.REVENUE (AMOUNT) VALUES (5879.23); 一 一 一 > 插入 NUES S879.23) 
COMMIT; 
--- 结果 如 下 
Se FROM DB2ADMIN.REVENUE; 
REVNO AMOUT 
1000 1382.06 
1001 2384.96 
1003 5879.23 
3. 生成 列 


生成 列 有 GENERATED ALWAYS 和 GENERATED BY DEFAULT 两 种 模式 。 在 DB2 中 ， 
生成 列 有 广泛 的 应 用 ， 比 如 在 5.4 节 将 要 讲 到 用 生成 列 控制 MDC 维度 列 的 粒度 。 下 面 来 看 一 
个 生成 列 的 简单 例子 ， 定 义 了 一 个 包含 生成 列 的 表 DB2ADMIN.SALARY， 在 插入 数据 时 ， 生 
成 列 netSalary 基于 已 有 列 salary 和 taxRate 根据 表达 却 目 动 生成 数据 。 在 定义 生成 列 时 ， 不 仅 
可 以 使 用 这 种 公式 ， 还 可 以 使 用 函数 ， 比 如 MONTHO 等 。 
CREATE TABLE DB2ADMIN.SALARY ( 
empno INTEGER, 
salary INTEGER, 


taxRate DECIMAL (5,2), 
netSalary DECIMAL(7,2) GENERATED ALWAYS AS (salary * (1 - taxRate)) 


) 


INSERT INTO DB2ADMIN.SALARY (empno, salary, taxRate) VALUES (1001, 40000, 0.35); 


SELECT * FROM DB2ADMIN.SALARY; 


EMPNO SALARY TAXRATE NETSALARY 
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1001 40000 0.35 26000.00 
4. 数据 迁移 
对 于 使 用 生成 列 《“ 包 括 标识 列 ) 的 表 ， 在 导入 数据 时 可 能 迪 到 下 面 的 错误 : 


SQL3550w 在 行 "FO-1" Xj "i" 中 的 宇 段 值 不 是 NULL， 但 是 目标 列 已 被 定义 为 
GENERATED ALWAYS. 


那么 怎么 解决 呢 ? 这 需要 特别 的 处 理 。 对 于 标识 列 ， 可 以 在 LOAD 时 使 用 identityoverride 
文件 类 型 修饰 符 ， 将 这 些 值 装 入 到 GENERATED ALWAYS 的 标识 列 ， 对 于 生成 列 ， 则 使 用 
generatedoverride 文件 类 型 修饰 符 。IMPORT 也 有 类 似 的 选项 identityignore 和 generatedignore, 
但 是 机 制 不 一 样 ， 读 者 可 以 进一步 了 解 。 

在 迁移 数据 库 时 ， 保 持 序 列 生 成 值 的 一 任性 很 重要 。 如 果 从 原始 库 导 出 DDL 的 时 间 与 寻 
出 数据 的 时 间 不 一 致 〈《 束 是 说 在 这 两 个 时 间 点 之 间 数 据 做 了 修改 ) ， 那 么 可 能 导致 目标 库 的 茶 
些 序 列 生 成 重复 值 。 遇 到 这 种 情况 ， 可 以 使 用 DB2 提供 的 下 列 语句 来 修改 序列 的 重 局 值 ， 下面 
的 语句 用 于 修改 序列 DB2ADMIN.CHARGESEQ 的 重启 值 : 


ALTER SEQUENCE DB2ADMIN.CHARGESEQ RESTART WITH 327691100 


4.2.7 处理 大 对 象 的 智慧 


数据 库 需 要 处 理 的 数据 是 多 种 多 样 的 ， 对 于 大 段 的 文本 、 图 片 、 首 频 和 视频 等 ，DB2 通过 
大 对 象 数据 类 型 来 存储 和 人 处理。 如 4.2.3 节 所 述 ，DB2 中 的 大 对 象 类 型 有 CLOB、DBCLOB 和 
BLOB. CLOB 存储 字符 大 对 象 ，DBCLOB 存储 双 字 节 字 符 大 对 象 ，BLOB 存储 图 片 和 音 视 频 
等 二 进 制 内 容 。 

1. 大 对 象 的 处 理 特点 


LOB 数据 (或 XML) 不 与 数据 行 存储 在 一 起 ，LOB 存储 在 外 部 存储 上 ， 每 个 LOB 字段 在 
行 记录 中 只 是 存储 一 个 LOB 描述 符 ， 指 问 LOB 数据 存储 的 位 置 。 

关于 大 对 象 的 处 理 ， 从 下 面 几 个 特点 去 考虑 : 

(1) 在 定义 含有 LOB 或 者 XML 数据 的 表 时 ， 应 该 为 这 些 大 对 象 的 存储 创建 相应 的 表 空 
IH], &AJH E CREATE TABLE FH “LONG IN tablespace-name” 子 名 指定 大 对 象 的 表 空 间 。 如 
果 没 有 指定 大 对 象 表 宇 间 ， 默 认 情 况 下 ， 大 对 象 会 存储 在 该 表 所 在 的 数据 表 空 间 。 

(2) LOB 数据 的 处 理 一 般 通 过 应 用 程序 处 理 ， 比 如 C 程序 、Java 程序 等 。 

(3) 循环 日 志 模 式 下 ，LOB 字段 的 更 改 不 会 记录 日 志 ; 归档 日 志 模 式 下 ， 默 认 对 LOB F 
段 的 更 改 记录 日 志 ， 但 是 可 以 用 NOT LOGGED 选项 选择 不 记 日 志 。 

(4) 对 第 规 数据 的 存 取 ， 会 利用 绥 剖 池 进 行 缓存 。 但 是 LOB 数据 的 得 询 和 存储 则 不 通过 
绥 冲 池 。 为 提高 性 能 ， 可 考虑 文件 系统 缓存 ， 即 在 创建 大 对 象 表 空 间 指 定 FILE SYSTEM 
CACHING 选项 。 可 以 考虑 用 VARCHAR 和 VARCHAR FOR BIT 来 代替 不 超过 32K 的 大 对 象 。 


2. 内 联 大 对 象 
某 些 应 用 中 ， 并 不 是 所 有 的 大 对 象 数 据 都 很 大 ， 有 些 只 有 几 百 字 节 或 者 儿 开 。 如 果 能 把 其 
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中 某 些 较 小 的 LOB 数据 直接 存储 在 行 记 录 中 ,会 有 助 于 性 能 提升 ,这 就 是 内 联 LOB(inline LOB) 
的 思想 。 

内 联 LOB 是 DB2 V9.7 引入 的 新 特性 ， 与 传统 的 LOB 访问 相 比 ， 可 以 利用 缓冲 池 缓存 ， 
提高 LOB 数据 的 查询 速度 。 同 时 ， 内 联 LOB 数据 也 能 利用 压缩 功能 减少 数据 存储 空间 。 


比较 : 内 联 LOB 和 内 联 XML 


在 DB2 V9.7 P, XML 也 是 可 以 内 联 的 ， 它 与 LOB 的 内 联机 制 是 一 样 。 区 别 在 于 ，LOB 
默认 是 内 联 的 ，XML 并 不 是 默认 内 联 ， 


内 联 LOB 通过 CREATE TABLE 语句 的 INLINE LENGTH 选项 来 指定 。 例如 , 在 下 面 定 义 
的 表 tlob F, CLOB 的 最 大 长 度 指定 为 2M， 而 内 联 长 度 指 定 为 1000 字 节 。 这 样 ， 如 果 记 录 的 
长 度 小 于 1000， 那 么 数据 将 存放 在 基 表 中 ， 其 他 长 上 度 大 于 1000 的 大 对 象 保 存在 外 部 存储 中 ， 
如 图 4-2 所 示 。 


CREATE TABLE tlob (a int; b char(53), © Cloob (2M) INLINE LENGTH 1000) 5 


基本 表 LOB 对 象 
a b c bbbbbbbbbbbbbbb 
cat bobbbbbbbbbbbbh 
|9 [dog ^ 
LOB E «-1000 LOB 长 度 >1000 


图 4-2 LOB 内 联 示 意 


对 于 内 联 LOB， 最 重要 的 任务 是 决定 INLINE LENGTH 的 长 度 。 

e 行 记录 的 长 度 不 能 超过 页 面 大 小 ， 也 束 是 内 联 长 度 加 上 其 他 关系 数据 字段 的 长 度 和 不 
能 超过 页 面 大 小 。 

e 可 以 根据 已 有 的 样本 数据 来 估计 LOB 数据 的 内 联 长 度 ， 这 可 以 使 用 DB2 V9.7 提供 的 
PK% admin est inline length 来 估算 。 

e 对 于 内 联 LOB 字段 ， 可 以 使 用 函数 admin is inlined 来 查询 每 个 LOB 是 否 是 内 联 的 。 

e 下 和 耐 讲 述 在 DB2 V9.7 中 ， 如 何 使 用 LOB AHK: 

(1) 首先 创建 tlob 表 ， 其 中 字段 c 为 CLOB (2M) ， 并 没有 显 式 指 定 为 内 联 。 导 入 一 些 
数据 后 , 用 admin is inlined PA Zi rit c3, ^e Ez c 在 主键 为 “3” 的 CLOB 数据 已 经 是 内 联 的 ， 
主键 为 “9” 和 “27” 是 非 内 联 的 。 

2 
DB20000I The SQL command completed successfully. 


bORA—HENE 


clo => select a, acmin is inlined(ec) as IS INLINED trom iE JEN d 


A IS INLINED 
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3 1 
9 0 
2 0 


3 record(s) selected. 
(2) 查询 SYSCAT.COLUMNS, XJ CLOB 字段 c 的 内 联 长 度 为 164， 说 明 默 认 的 内 联 
长 度 相 对 较 小 。 


dip => select substr (tabname, 1,10) 
inline length from scs cH Columns where tabname =" TLOB " 


as tcabname, substre (colname, 1,10) as colname, 


TABNAME COLNAME INLINE LENGTH 


TLOB A 0 
TLOB B 0 
TLOB C 164 


3 record(s) selected. 


(3) 使 用 admin est inline length 函数 估算 这 些 CLOB 数据 内 联 所 需要 的 存储 长 度 ， 可 以 
发 现 主键 为 “3” 的 CLOB 字段 内 联 长 度 为 20， 小 于 164， 所 以 可 以 成 功 内 联 ， 但 是 ， 主 键 为 
“9” 和 “27” 的 CLOB 字段 内 联 宕 要 的 存储 长 度 分 别 为 1389 和 368， 都 超过 了 164， 上 所 以 没 
有 实现 内 联 。 


clo => select a, acmin est inline length (e) 


as EST _ INLINE LENGTH from tlob; 


A DST INLINE LENGTH 
E 20 
9 789 
2 368 


3 record(s) selected, 
(4) 为 了 实现 更 多 数据 的 内 联 ， 可 以 通过 ALTER TABLE 语句 将 内 联 长 度 从 164 修改 为 
1000。 然 后 用 带 有 longlobdata 选项 的 reorg 命令 重组 表 。 


db2 => alter table tlob alter column c set inline length 1000; 
DB20000I The SoL command completed successfully. 


db2 => reorg table tlob longlobdata; 
DB20000I The REORG command completed successfully. 


外 注意 : 修改 内 联 长 度 的 技术 要 求 
修改 内 联 长 度 时 只 能 增 大 内 联 长 度 , 例如 从 164 到 1000, 不 能 减 小 , 即 不 能 从 1000 到 164. 


(5) 再 次 使 用 admin is inlined 函数 人 查询， 发 现 本 例 中 所 有 的 CLOB 数据 都 已 经 成 功 内 联 了 。 


Clo => select a, acmin is inmlined(e) as IS INLINED from 七 上 OO5 


A IS INLINED 
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2 1 


3 record(s) selected. 


4.83. FNAS B3 I FS ae 


在 处 理 复 杂 业 务 逻 辑 的 应 用 中 ， 特 别 是 存储 过 程 中 ， 临 时 表 有 着 广泛 的 应 用 ， 主 要 用 于 存 
储 一 些 中 间 处 理 结果 。DB2 支持 两 种 临时 表 : 已 声明 全 局 临时 表 CDGTTO 和 已 创建 全 局 临时 
K CCGTTO ， 它 们 之 间 的 区 别 主 要 在 于 作用 域 ， 在 下 面 将 会 基体 探讨 。 

要 想 用 好 临时 表 不 是 一 件 容易 的 事 ， 很 多 用 户 有 这 样 的 问题 : 

(1) 临时 表 能 用 来 在 存储 过 程 之 间 传 递 数 据 吗 ? 

(2) 临时 表 的 数据 在 提交 之 后 怎么 就 消失 了 ? 

(3) 临时 表 能 用 来 在 不 同 会 话 (session) 间 传 递 数 据 吗 ? 

这 一 市 将 深入 阅 述 临时 表 的 特性 和 使 用 ， 并 回答 上 述 问 题 。 
G 注意 ;必须 为 临时 表 创 建 表 空间 

必须 为 临时 表 创 建 合适 的 用 户 临 时 表 空 间 , 否则 DB2 会 报 SQL0286N 的 错误 , 说 没 
有 合适 的 表 空 间 ， 所 以 在 数据 库存 储 规划 时 ， 应 根据 需要 为 临时 表 创 建 相应 的 表 空 间 和 


例如 ， 创 建 页 大 小 为 16K 的 用 户 临 时 表 空 间 ts_tmp16k， 这 个 临时 表 空 间 使 用 缓冲 
池 bp tmplók: 


CREATE BUFFERPOOL bp tmpl6k SIZE 1500 PAGESIZE 16K 

CREATE USER TEMPORARY TABLESPACE ts tmpl6k pagesize 16K MANAGED BY DATABASE 
USING (FILE da Toor 2 G ) 

BUFFERPOOL bp tmpl6k 


4.3.4 声明 全 局 临时 表 (DGTT) 


在 DB2 V9.5 及 其 以 前 的 版 本 中 ， 声 明 全 局 临时 表 (Declared Global Temporay Table) 是 唯 
一 文 持 的 用 户 自 定义 临时 表 , DGTT 的 定义 并 不 会 在 DB2 的 系统 编目 表 中 存储 ,那么 DGTT 的 
作用 域 是 怎么 样 的 呢 ? 
(1) 表 定 义 作 用 域 : 作用 域 只 在 当前 会 话 中 ， 也 束 是 说 ， 在 每 个 会 话 中 都 必须 声明 ， 然 
后 才能 使 用 它 ， 会 话 结束 时 临时 表 将 被 删除 。 这 种 作用 域 上 只 与 会 话 有 关 ， 而 与 存储 过 程 的 作用 
域 或 者 调用 关系 没有 任何 关系 。 例 如 ， 在 存储 过 程 A 中 声明 了 临时 表 T，A 调用 存储 过 程 B， 
Æ B 中 仍然 可 以 使 用 临时 表 工 ， 甚 至 调用 A 的 程序 也 可 以 操作 临时 表 T. 
ISO RAA 
DGTT 的 模式 名 必须 为 SESSION。 只 要 同一 个 会 话 中 ,临时 表 就 可 以 被 所 有 的 存储 
过 程 访 问 ， 也 不 需要 用 参数 来 传递 临时 表 。 
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(2) 数据 作用 域 : 临时 表 中 的 数据 是 会 话 隔离 的 ， 不 同 会 话 之 间 不 会 共享 数据 。 这 又 可 
以 细 分 为 如 下 两 种 : 
e 事务 级 : 在 声明 时 由 ON COMMIT DELETE ROWS 子 句 指定 , 每 次 事务 提交 (或 回 深 ) 
后 ，DB2 将 删除 临时 表 中 的 数据 。 
e 会 话 级 : 在 声明 时 由 ON COMMIT PRESERVE ROWS 子 句 指定 ， 事务 提交 时 临时 表 的 
数据 将 保留 ， 数 据 在 整个 会 话 期 间 都 存在 ， 会 话 结束 时 数据 才 被 清除 。 
还 可 以 使 用 NOT LOGGED 子 名 指定 对 DGTT 临时 表 的 操作 不 记录 日 志 , 创建 DGTT 的 语 
法 使 用 “DECLARE GLOBAL TEMPORARY TABLE”， 如 下 所 示 ， 读 者 需要 注意 其 中 的 ON 
COMMIT [PRESERVE|DELETE] ROWS 选项 ， 如 下 所 示 : 


DECLARE GLOBAL TEMBPORARY TABLE <taole name> ( 
<columns definition> ) 

ON COMMIT [PRESERVE|DELETE] ROWS 

[NOT LOGGED ON ROLLBACK [PRESERVE|DELETE] ROWS ] 
[WIETH REPLACE ] 


IN «tablespace-name»; 


下 面 的 例子 声明 了 临时 表 session.dgtt1， 并 指定 了 ON COMMIT DELETE 选项 。 插 入 2 条 记 
录 后 ， 能 得 到 新 插入 的 数据 。 事 务 提 交 后 ， 数 据 被 自动 删除 。 会 话 结束 后 ， 临 时 表 将 不 复 存 在 。 


CONNECT TO dbname; 
update command options using c off; -- 关 闭 上 自动 提交 开关 


DECLARE GLOBAL TEMPORARY TABLE session.dgttl1 
(id INT NOT NULL, name VARCHAR(20), d DOUBLE) 
ON COMMIT DELETE ROWS IN ts tmplók; 


INSERT INTO session.dgttl(id, name, d) 
本 SS 人 


DB20000I The SQL command completed successfully. 


SEDBESTOISUBPOMSESSSssToOmneclceie 


ID NAME D 
1l Jim +3-45967000000000E7003 
2 TOM +1. 05700000000000EF002 


2 record(s) selected. 


COMMIT; 
DB20000I The SQL command completed successfully. 


SEN ROME SEEK La 


0 record(s) selected. 
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下 面 的 例子 声明 了 临时 表 session.dgtt1， 并 指定 了 ON COMMIT PRESERVE 选项 。 插 入 2 
条 记录 后 ， 能 奏 到 新 插入 的 数据 。 事 务 提交 后 ， 数 据 依然 保留 ， 仍 能 租 询 到 这 些 数据 。 会 话 络 
束 后 ， 临 时 表 也 不 复 存在 。 

DECLARE GLOBAL TEMPORARY TABLE session.dgttl1 


(id INT NOT NULL, name VARCHAR(20), d DOUBLE) 
ON COMMIT PRESERVE ROWS IN ts tmplók; 


INSERT INTO session.dgttl(id, name, d) 

VALUES (1, “Jim”, 3459.67); (2, "Tom"; 105.7)% 
COMMIT; 
SELECT * FROM session.dgttl1 


ID NAME D 
1 Jim +3- 4596700000000067 003 
2 TOM +i. 053700000000000 E7002 


2 record(s) selected. 


CONNECT RESET; 

CONNECT TO dbname; 

SEN RONE ESO Ol 

SOLO20Q4AN “SESSION. DETTI” is an undefined name., SOLSTATE=42704 


4.3.2 创建 全 局 临时 表 (CGTT) 


DB2 V9.7 开始 支持 创建 全 局 临时 表 CCGTTO ， 为 了 帮助 读者 更 好 地 理解 CGTT， 接 下 来 
通过 和 DGTT 对 比 的 方式 探讨 一 下 CGTT。 
e 表 定 义 作用 域 ， 与 DGTT 不 同 ，CGTT 的 定义 持久 保存 在 DB2 的 系统 编目 中 ， 不 需要 
在 每 个 会 话 中 重新 定义 ， 而 是 在 各 个 会 话 之 间 共 孚 。 
e 数据 作用 域 : 与 DGTT 基本 类 似 ，CGTT 数据 在 会 话 中 是 私有 的 ， 在 会 话 之 间隔 离 ， 
每 个 会 话 操作 的 数据 只 能 在 本 会 话 中 可 见 ， 其 他 会 话 的 数据 在 本 会 话 不 可 见 《〈 仿 佛 那 
些 数据 不 存在 ) ， 会 话 结束 后 ， 该 会 话 操 作 的 数据 将 被 清除 。 
从 下 面 的 存储 过 程 可 以 看 到 , 创建 CGTT fi H] "CREATE GLOBAL TEMPORARY TABLE" 
语句 ， 由 于 表 定 义 在 不 同 会 话 之 间 共 享 ， 存 储 过 程 sp a 和 sp b 都 可 以 操作 预先 定义 的 
db2admin.cgtt. 


CREATE GLOBAL TEMPORARY TABLE db2admin.cgtt 
(id INT NOT NULL, name VARCHAR(20), v INT) 
ON COMMIT DELETE ROWS IN ts tmploókéà 


CREATE Or replace PROCEDURE ep bolin uid int, in ratio INT) 
BEGIN 
UPDATE Co2acmin cgtE SET y = y ~% ratio WHERE ic = uidis 
ENDG 


CREATE OF replace PROCEDURE SP 让 (OULE sum LNT) 
BEGIN 
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INSERT INTO cbz2acmin.cgtt (icd, name, YV) 
VALUES (1, “Jim”, 100); (2, "Tom", 200) 5 
CALL SB BB(l1; C 
SELECT SUM(Y) INIO sum FROM do2acnin.catts 
ENDG 


(Pn SS a(?) 
Value of output parameters 


Parameter Name : SUM 


Parameter Value : 500 


Return Status 三 Q0 


如 果 用 DGTT RAER, MAR ER. HOEBUSCHLINR UE PPIZR. TE sp a HAE 
Hj DGTT session.tmnp1， 然 后 在 sp b 中 用 动态 SQL 语句 修改 session.tmpl 中 的 数据 。 


CREATE OF replace PROCEDURE SB &l(out sum LNT) 
begin 
declare global temporary table session.tmpl1l 
(ic INT NOT NULG, name wsueseudabexse 2210 vr Y INT) 2 
INSERT INTO session.tmpl (id, name, v) 
VALUES (1, “Jim”, 100); (2, “TeOm!, 200) 5 
CALL sp bli, 3)8 
SELECT SUM(v) INTO sum FROM session.tmpl; 
end@ 
CREATE Or replace PROCEDURE ep blin uid int, in ratio INT) 


begin 
EXECUTE IMMEDIATE 'UPDATE session.tmpl SET v —- v * ' 
II gcario II " WAERE 10 = Y |] uidis 
end 


Aa 注意 : 只 能 使 用 动态 SQL 语句 访问 sess 
在 sp b 中 不 能 使 用 静态 SQL 语句 访问 session.tmpl, 3X X E] A session.tmpl 是 在 执 
ÍT sp a 时 声明 的 ， 在 创建 sp b 时 编译 器 无 法 确定 session.tmpl 是 否 已 声明 。 


4.3.3 


在 DB2 V9.7 中 ， 如 末 临 时 表 的 数据 量 比较 大 ， 可 以 在 临时 表 上 创建 索引 ， 也 可 以 对 临时 
表 尼 用 压缩 。 

普通 表 相 比 ， 临 时 表 (包括 DGTT 和 CGTTO 有 如 下 优点 : 

e 由 于 临时 表 中 的 数据 在 各 会 话 之 间隔 离 ， 不 需要 行 锁定 ， 所 以 能 提高 并 发 性 能 。 

e 在 某 些 应 用 中 可 使 用 临时 表 NOT LOGGED 选项 ， 不 记录 日 志 ， 从 而 提高 性 能 。 

e 如 条 临 时 表 创 建 了 索引 ，DB2 编 详 器 会 将 这 些 索 引 考 虑 在 内 。 由 于 特定 会 话 中 的 

Runstats 只 会 考虑 本 地 数据 ， 这 将 允许 各 会 话 使 用 不 同 的 访问 计划 。 
临时 表 在 许多 应 用 下 都 可 以 带 来 好 处 。 最 容易 理解 的 应 用 是 在 线 购物 车 ， 会 话 开 始 后 每 个 


/小结 


128 


第 4 章 hdd um 


用 户 可 以 往 购物 车 加 商品 ， 只 有 在 用 户 真 正 购 买 商 品 后 才 会 复制 到 实际 的 订单 表 中 ， 并 在 会 话 
结束 时 销毁 它 的 数据 。 请 参考 《从 Oracle 到 DB2 开发 从 容 转 叶 》 第 5 章 相 天 内 容 。 


44 ”无 处 不 在 的 时 态 表 


“时 间 束 古 金钱 ， 效率 就 是 生命 。”DB2 VIO 新 引入 的 时 态 数据 管理 技术 以 一 种 简洁 有 效 的 
方式 管理 随时 间 变 化 的 数据 版 本 ， 这 可 以 节省 数据 库 管 理 员 和 应 用 开发 人 员 大 量 的 时 间 和 精力 。 

时 态 数据 几乎 在 所 有 行业 都 有 看 广泛 的 应 用 场景 ， 比 如 银行 、 你 险 、 金 融 、 和 零售 和 电子 商 
务 等 


下 二 o 


.4.1 无 处 不 在 的 时 间 


数据 随时 间 而 变化 ， 先 来 看 一 下 时 态 数据 的 具体 应 用 场景 : 

(1) 审计 人 员 对 金融 机 构 的 交易 员 在 过 去 1 年 内 的 交易 记录 进行 审计 。 

(2) 证 券 公司 记录 股民 的 详细 交易 记录 ， 用 于 审计 和 用 户 查 询 分 析 。 

(3) 某 在 线 购 物 网 站 对 用 户 消 费 的 历史 数据 进行 分 析 ， 并 有 和 针对 性 地 推出 某 些 产品 的 打 
折 消 息 。 

(4) 保险 公司 确认 发 生 事故 后 ， 根 据 客 户 保单 的 时 间 周 期 和 有 效 条 天 进行 赔偿 。 

(5) 项 目 管理 中 ， 记 录 人 员 在 各 个 项 目 中 的 工作 时 间 ， 从 而 计算 工时 和 评估 绩效 ， 比 如 A 
员工 从 2012-03-04 到 2012-04-08 在 甲 项 目 中 工作 , 而 2012-04-09 到 2012-03-15 在 乙 项 目 中 工作 。 

(60 一 家 在 线 旅行 公司 为 客户 规划 10 天 的 旅游 行程 ， 并 希望 检测 行程 中 的 不 一 致 性 。 比 
如 预定 北京 一 家 酒店 3 天 ， 但 其 中 的 一 天 却 同时 预订 了 上 海 的 一 家 酒店 ， 这 种 冲突 需要 避免 。 

CI) 信用 卡 用 户 伍 询 消费 记录 ， 如 果 发 现 交 易 的 数据 错误 或 者 利率 计算 有 问题 ， 银 行 需 
要 人 退 溯 以 前 的 数据 来 更 正 错 误 或 重新 计算 利 县 。 

在 DB2 V10 以 前 的 版 本 中 ， 实现 这 样 的 时 态 数 据 管 理 ， 并 不 是 件 轻松 的 事情 ,需要 创建 触 
发 器 或 复杂 的 应 用 逻辑 来 管理 时 态 数 据 。DB2 V10 引入 了 时 态 表 ， 简 化 了 应 用 的 处 理 逻 辑 ， 实 
现 了 数据 版 本 的 目 动 管理 。 


比较 : 系统 时 间 和 应 用 时 间 

系统 时 间 跟 踪 何 时 对 表 的 数据 进行 了 更 改 ， 比 如 股票 交易 的 时 间 、 活 期 银行 账户 的 存 取款 时 
间 ; 应 用 时 间 也 称 为 业务 时 间 ， 用 来 跟踪 业务 条 件 的 有 效 期 。 比 如 保单 的 有 效 时 间 周 期 或 定期 贷 
款 的 期 限 。 换 回话 说， 系统 时 间 就 是 系统 自动 生成 的 时 间 ， 而 应 用 时 间 则 是 用 户 指定 的 时 间 。 


场景 d), D (0 对 应 的 是 系统 时 间 ， 它 指 的 古 数 据 的 历史 有 版本; 场景 (4) G) 
和 《6) 需要 的 是 应 用 时 间 ， 它 管理 各 种 业务 条 件 的 有 效 期 ;场景 7) 则 同时 需要 系统 时 间 和 
应 用 时 间 。 

根据 处 理 时 间 的 方式 ， 可 以 将 时 态 表 分 成 下 面 的 3 种 类 型 : 
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e 条 统 时 间 周 期 的 时 态 表 (System-period Temporal Table， 人 简写 为 STT) 。 

e 应 用 时 间 周 期 的 时 态 表 (Application-period Temporal Table， 简 写 为 ATT) à- 

e 双 时 态 表 (Bitemporal Table) : 结合 了 STT 和 ATT 两 种 特性 ， 既 拥有 业务 时 间 周 期 特 

性 ， 又 拥有 系统 时 间 周 期 特性 。 

对 于 时 态 表 ， 不 管 是 系统 时 态 表 还 是 应 用 时 态 表 ， 都 有 额外 的 两 个 时 间 罕 段 ， 即 起 始 时间 
和 结束 时 间 用 来 表明 每 一 行 数据 的 有 效 时 间 周 期 。 对 于 系统 时 态 表 ， 还 有 一 个 相同 结构 的 历史 
表 与 之 关联 ， 用 于 存储 历史 数据 版 本 ， 当 系统 时 态 表 中 的 数据 被 更 狐 时 ，DB2 目 动 将 更 新 数据 
转移 到 历史 表 中 。 


4.4.2 ARAR 


下 面 通过 股票 交易 的 例子 来 说 明 ， 这 个 例子 包括 股票 的 买 入 、 增 持 和 卖 出 等 操作 。 在 处 理 
查询 时 ，DB2 会 根据 需要 透明 地 访问 历史 表 ， 从 而 轻松 处 理 历 史 数据 ， 并 不 需要 应 用 编写 包含 
各 种 时 间 惟 的 复杂 WHERE 子 句 。 


1. 创建 系统 时 态 表 


包括 下 面 3 个 步骤 : 
(1) 创建 系统 时 态 表 stock 
除了 基本 字段 外 ， 基 表 还 需要 包含 额外 的 3 个 TIMESTAMP(12) 字段 ， 这 3 个 字段 可 定义 
为 GENERATED ALWAYS， 这 样 在 插入 、 更 新 和 删除 时 ，DB2 残 会 目 动 生成 这 3 个 字段 的 值 。 
如 下 所 示 ， 创 建 时 态 表 stock, HP sys start 为 开始 时 间 ，sys_end 为 结束 时 间 ，PERIOD 
SYSTEM TIME(sys _startsys_end) 子 句 指 定数 据 的 有 效 时 间 段 。trans_start 为 影响 当前 行 数据 变 
化 的 事务 开始 时 间 ， 将 其 指定 为 隐藏 字段 CIMPLICITLY HIDDEN) 。 


CREATE TABLE stock ( 


account no INTEGER NOT NULL, 
SE Oed NO INTEGER NOT NULL, 
shares DECINMALG(1LS;,2) NOP NULL, 


c ceci EE TIMESTAMP(12) NOT NULL 
GENERATED ALWAYS AS ROW BEGIN, 
sys ne TIMESTAMP (12) NOT NULL 
GENERATED ALWAYS AS ROW END, 
trans start TIMESTAMP (12) 
GENERATED ALWAYS AS TRANSACTION START ID IMPLICITLY MIDDEN, 
PERIOD SYSTEM TIME (sys _ Start, sys endl) 


(2) 创建 历史 表 stock history 
历史 表 的 定义 结构 与 当前 表 相 同 ， 可 使 用 CREATE TABLE--LIKE 语句 轻松 创建 。 


CREATE TABLE sSTtOCk history LIKE STOCK / 


(3) 关联 历史 表 ， 局 用 版 本 控制 
使 用 ALTER TABLE 语句 的 ADD VERSIONING 子 句 将 历史 表 关 联 到 当前 表 并 启用 版 本 
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ALTER TABLE stock 
ADDEN REGON COEM UT OUI S OMETURL ll 


2. 对 系统 时 态 表 插入 、 更 新 和 删除 操作 


先 但 看 一 下 当前 表 stock 和 历史 表 stock. history 中 的 数据 : 


select * from stock 


ACCOUNT NO STOCK NO SHARES SYS START SYS END 

12001 600068 95900.00 2012=12=01=09.40.32 -000000000000 
9999=-12=30=00 -~ 00.00. 000000000000 

12001 600735 12000.00 2012=10=15=14.48.02 -000000000000 
9999=12=30=00 ~ 00.00. 000000000000 

12001 601633 7900.00 2011=09=09=]10.25.28.000000000000 
9999=-12=30=00 ~ 00. 00. 000000000000 

12001 602179 10000.00 2013=01=28=13.21.18.000000000000 


9999=12=30=00 ~ 00.00. 000000000000 


4 record(s) selected. 


gereci Ense c KM eory 


ACCOUNT NO STOCK NO SHARES SYS START SYS END 
12001 600068 2500.-00 2011=09=01=14. 00. 00.000000000000 
2012=12-01-=-09._ 40 -32.000000000000 
12001 600731 6000.00 2009=-12=01=10.03.18.000000000000 
2010=01=01=13.21.18.000000000000 
12001 602179 10000.00 2010=02=01=05.453,.02 -000000000000 


2013=01=28=13.21.18.000000000000 


3 record(s) selected. 


- 


ZLA IMPLICITLY HIDDEN 的 trans start 字段 在 “SELECT *” 语 句 中 并 不 会 显示 


o 


(1) 插入 时 态 数据 
插入 时 态 数 据 时 无 有 顷 对 3 个 时 间 字 段 赋值 ，DB2 会 目 动 为 它们 生成 合适 的 值 。 如 下 所 示 ， 
sys start 的 值 被 设置 为 开始 时 间 ， 而 sys end 被 值 设置 为 最 大 值 9999-12-30- 
00.00.00.000000000000 。 


INSERT INTO stOCk (account no, SEO NO, shares) VALUES (12001; 608712, 1500) 
DB20000I The SQL command completed successfully. 


SELECT aCCOUNE no, STOCK NO, Shares, SYS _ Start, eve end FROM sTOCk WHERE account ne 
= 12001 and stock wo = 606712 
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ACCOUNT NO STOCK NO SHARES SYS START SYS END 


12001 608712 1500.00 2013=02=03=02.15.44.886174000000 
9999=12=30=00 . 00.00. 000000000000 


1 record(s) selected. 


(2) 更 新 时 态 数据 

更 新 时 态 数 据 时 , 会 产生 数据 版 本 变化 ， 更 新 前 的 版 本 会 自动 保存 到 历史 表 中 。DB2 将 历 
史 表 中 的 sys end 值 和 当前 表 中 的 sys. start. 值 设 置 为 该 事务 的 开始 时 间 。 如 果 在 同一 事务 内 多 
次 更 新 行 ，DB2 并 不 会 在 历史 表 创 建 多 条 历史 记录 ， 而 仅仅 保留 最 初 的 旧版 本 。 

UPDATE stock 


ee 
人 


SELECT account no, StOCk NO, Shares, Sys _ start, Sys end FROM sTOCk WAERE account ne 
= 12001 anad stock no = 6000668 


ACCOUNT NO STOCK NO SHARES Ss START SYS END 


12001 600068 8500.00 2013-02-03-02.15.45.080586000000 
9999=12=-30=00 ~ 00. 00. 000000000000 


1 record(s) selected. 


SELECT account no, Lec NO, shares, Sys _ Start, see FROM stOCk history TREE dS 
account no = 12001 and è stock no = 600066 


ACCOUN OL SUBOIG e NO SHARES S SUAE SYS END 
12001 600068 2500.-00 2011=-09=01-=14 00. 00.000000000000 
2012=12=-01=09 40.32. 000000000000 
12001 600068 5500.00 2012-12-01-09.40.32.000000000000 


2013-02-03-02.15.45.080586000000 


2 record(s) selected. 


(3) 删除 系统 时 态 数据 
删除 数据 时 ，DB2 会 将 当前 表 中 的 数据 删除 ， 并 将 删除 的 数据 版 本 目 动 保存 到 历史 表 中 。 
历史 表 的 sys end. 值 设 营 为 该 事务 的 开始 时 间 。 


DELETETEROME C EOCK HERES OC One nO 00 CM dra 0 SIS 
DB20000I The SoL command completed successfully. 


SELECT account no, Sos NO, shares, Sys _ Start, sse encd! PROM stOCk history WEERE 
account no = 12001 and stock no = 600735 
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ACCOUNT NO STOCK NO SHARES SYS START SYS END 


12001 600735 12000.00 2012-10-15-14.48.02.000000000000 
2013-02-03-02.15.45.375786000000 


1 record(s) selected. 


3. 查询 系统 时 态 数 据 


查询 系统 时 态 表 的 当前 数据 与 查询 普通 表 完 全 一 样 ， 得 到 的 数据 为 最 新 版 本 。 如 果 需 要 查 
询 各 种 历史 版 本 ， 可 以 使 用 DB2 提供 的 3 种 新 语法 : 

e FOR SYSTEM TIME AS OF timestamp: 查询 某 个 时 间 点 的 数据 ，DB2 会 自动 访问 历 
史 表 获取 合适 的 数据 。 

e FOR SYSTEM TIME FROM begin TO end: 查询 时 间 点 从 begin 到 end 的 数据 版 本 。 该 语 
法 是 半 开 区 间 ，“ 含 头 不 含 尾 ”， 即 指定 的 begin 包含 在 时 间 段 内 ， 但 end 不 包含 在 内 。 

e FOR SYSTEM TIME BETWEEN begin AND end: 查询 时 间 点 从 begin 到 end 的 数据 版 
本 。 该 语法 是 财 区 间 ，“ 售 头 售 尾 ”， 指 定 的 开始 和 结束 时 间 都 包含 在 时 间 段 内 。 

e 使 用 时 态 条 件 查 询 系 统 时 态 表 的 示例 如 下 所 示 : 


SELECT account no, SEOCk NO, Shares, SyS Start, Sys end PROM stock 
FOR SYSTEM_TIME AS OF '2011-10-01' 
WHERE &ccount no = 12001 


ACCOUNT NO STOCK NO SHARES SYS START SYS END 
12001 600068 2300.-00 2011=09=01=14. 00. 00.000000000000 
2012=12=01=09.40.32.000000000000 
12001 602179 10000.00 2010=02=-01=05.453,.02 -000000000000 
2013=01=28=13.21.18,.000000000000 
12001 601633 79500.00 2011=09=09=10.25.28.000000000000 


E 0 O O OO O O O O0 
3 record(s) selected., 
SELECT account no, STCOCk NO, Shares, SyS _ Start, sys end FROM stock 


FOR SYSTEM TIME FROM '2009-11-01-00.00.00' TO '2011-09-01-14.00.00' 
WHERE &ccount no = 12001 


ACCOUNT NO STOCK NO SHARES SYS START SMOREN 
12001 600731 6000.00 2009-=12=01=10.03.18.000000000000 
2010-01-01=13.21.16.000000000000 
12001 602179 10000.00 2010-02-01=05.45.02.000000000000 


2013=01=28=13.21.18,.000000000000 
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2 record(s) selected. 


SELECT account no, SEOCk NO, Shares, Sys _ Start, sys end oils 
FOR SYSTEM_TIME BETWEEN '2009-11-01-00.00.00' AND '2011-09-01-14.00.00' 
WHERE &ccount no = 12001 


ACCOUNT NO STOCK NO SHARES SYB START AS 
12001 600068 2500.00 2011-09-01-14.00.00.000000000000 
2012-12-01-09.40.32.000000000000 
12001 600731 6000.00 2009=-12=01=10.03.18.000000000000 
2010=01-01=-153.21.18.000000000000 
12001 602179 10000.00 2010=02=01=05.45,.02 -000000000000 


2013=-01=28=13.-21.18.-000000000000 


3 record ls) selected. 


对 时 态 数据 的 查询 在 FROM 子 句 中 仅 引 用 当前 表 ，DB2 会 自动 访问 历史 表 . 


可 以 看 到 ， 系 统 时 态 表 的 语法 简单 明了 ， 极 大 地 减少 了 应 用 罗 辑 ， 并 确保 所 有 应 用 程序 一 
致 地 处 理 时 间 相关 的 数据 ， 


4.4.3 ”应 用 时 态 表 


应 用 时 态 表 用 于 跟踪 某 些 业务 时 间 相 关 的 数据 。 例 如 ， 一 份 保险 的 有 效 期 为 一 年 ， 从 2012 
年 1 月 1 日 到 2012 年 12 月 31 日 ， 以 及 4.4.1 小 节 提 到 的 项 目 时 间 管 理 、 旅 游行 程 管 理 等 。 

跟 系 统 时 态 表 一 样 , 应 用 时 态 表 也 需要 使 用 一 个 时 间 段 (业务 条 件 的 开始 和 结束 时 间 点 )。 
但 是 ， 应 用 时 态 表 有 下 面 的 特点 : 

e 应 用 时 态 表 没有 独立 的 历史 表 ， 它 的 数据 以 及 相应 的 业务 有 效 时 间 都 在 一 个 表 中 进行 

维护 。 

e 用 户 在 回应 用 时 态 表 中 插入 数据 时 需要 提供 业务 时 间 段 的 开始 和 结束 值 。 

e 应 用 时 态 表 不 需要 使 用 事务 开始 时 间 字 段 。 

e 下 面 以 保险 行业 的 保单 为 例 ， 曾 述 一 下 应 用 时 态 表 的 各 种 功能 。 

1. 创建 应 用 时 态 表 


创建 应 用 时 态 表 的 语法 很 简单 ， 例 如 在 保单 表 中 ，bus_start 和 bus end 字段 定义 为 DATE 
类 型 ，PERIOD BUSINESS TIME 子 句 表明 这 两 个 字段 用 来 跟 中 每 行 数据 的 有 效 开 始 时 间 和 结 
束 时 间 。 

DB2 会 自动 生成 一 个 隐 式 约束 来 强制 要 求 bus_start 值 小 于 bus. end 值 ， 从 而 确保 时 态 数 据 
的 完整 性 。 男 外 ， 在 应 用 时 态 表 上 ， 还 可 以 根据 应 用 时 间 建 立 唯 一 索引 ， 这 样 可 以 确保 同一 行 
数据 不 能 同时 拥有 两 个 版 本 ， 如 下 例 中 的 索引 idx_insr 所 示 : 


CREATE TABLE insur policy 
ace no INTEGER NOT NULL, 
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insur type VARCHAR (10), 

insur premium DECIMAL(15,2) NOT NULL, 
insur Coverage DECIMAL(1S,2) NOT NULE., 
DUS ae DATE NOT NULL, 

DUSE E DATE NOT NULL, 


PERIOD BUSINESS TIME (bus start, bus endl) 


) 5 
CREATE UNIQUE INDEX idx insr 
ONE Su Epoca nop BUSNES ENNIO DET OVERTAS) 


2. 对 应 用 时 态 表 插入 、 更 新 和 删除 操作 


应 用 时 态 表 的 插入 、 更 新 和 删除 操作 会 引起 数据 业务 时 间 有 效 期 的 变化 ， 下 面 分 别 讲解 。 

CIO 插入 时 态 数 据 

插入 数据 与 普通 表 一 样 ， 非 常 俐 单 ， 只 需 为 表 中 的 学 段 (包括 开始 和 结束 时 间 季 段 〉， 提 供 
合适 的 值 。 例 如 ， 回 保单 表 中 插入 数据 的 语句 如 下 所 不: 


INSERT INTO insur policy (acc_ no, insur type, insur premium, 
insur Coverage, bus start, bus endl) 
VALUES (1001, “A01”, 1200, 200000, “2009=11-=-01", “20135=11=01"),; 
(1002, "A02", 2000, 450000, "2010-=-01=01", “2013=01=01"), 
(1003, “A01”, €00, 140000, "2010=02=01", “2011=02=01"), 
(1004, "B02"; ©6000, 800000, "2011=01=01", “2011=12=31")7% 


SELECT &ce no, insur type, insur premium, insur Coverage, bus start, bus encd FROM 


insur policys 


ACC NO INSUR TYPE INSUR PREMIUM INSUR COVERAGE BUS START BUS END 
1001 A01 1200.00 LOOP OT O T EET or OBI ST Ee A0 307172 0E S 
1002 A02 2000.00 人 
1003 A01 800.00 UOO O 0191224081017: OI 
1004 B02 6000.00 0 


4 record(s) selected. 


与 系统 时 态 表 不 同 ， 向 应 用 时 态 表 插 入 数据 需要 为 两 个 日 期 字段 提供 值 。 


由 于 定义 了 不 允许 应 用 时 间 段 重 登 的 唯一 索引 ， 辐 应 用 时 态 表 插 入 时 间 段 重 登 的 数据 将 会 
报错 。 如 下 所 示 ， 帐 号 1002 的 有 效 业 务 时 间 段 为 2010-01-01 到 2013-01-01, EI] XU NV AS 
时 间 段 为 2012-01-01 到 2012-07-01 的 数据 时 ， 因 为 违背 了 唯一 性 约束 所 以 会 报错 。 如 果 硕 望 调 
Hk 1002 在 2012-01-01 到 2012-07-01 期 间 的 保险 ， 可 以 使 用 合适 的 UPDATE 语句 来 实现 。 


INSERT INTO insur policy (acce_ no, insur type, insur premium, 
insur Coverage, bus start, bus endl) 
VALUES (1002, “AQI”, 16800, 500000, "2012=01=01", "2012=07=01") 8 
DB21034E The command was processed as an SQL statement because it was not a 
valid Command Line Processor command. During SQL processing it returned: 


SOLO803N One or more values in the INSERT statement, UPDATE statement, or 
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foreign key update caused by a DELETE statement are not valid because the 
primary key, unique constraint or unique index identified by "1" constrains 
cable “DB2ADMIN, INSUR POLICY" from naving duplicate values tor the index key- 
SOLSTATE-23505 


(2) 更 新 时 态 数据 
对 应 用 时 态 表 的 更 新 操作 可 以 是 普通 的 UPDATE 语句 ， 也 可 以 用 新 语法 PORTION OF 


BUSINESS TIME 子 句 ， 表 示 只 更 狐 某 个 时 间 有 段 的 数据 。 


FN 


语句 中 的 时 态 限 制 (FOR PORTION OF BUSINESS TIME FROM…TO… ) 直接 跟 在 
表 名 之 后 ， 而 不 是 WHERE 子 句 的 一 部 分 。 


更 新 应 用 时 态 数据 时 ， 会 产生 数据 有 效 期 的 变化 ， 甚 至 一 行 数 据 可 能 被 拆 分 成 多 行 数据 。 
如 下 所 示 的 UPDATE 语句 提高 帐号 1001 在 2010 年 整个 年 度 的 保费 和 保 额 , 于 是 原来 的 一 条 数 
据 拆 分 成 了 3 条 数据 ， 业 务 时 间 的 有 效 期 也 相应 发 生 了 改变 。 


UPDATE insur policy 
POR PORTION OF BUSINESS TIME FROM "2010-01-01" TO "2011=01=01 
SEM ne Ar pren a — 2/0007. ne T oer aa ccs AO 
WHERE acc no = 1001 ; 


SELECT sued no, insur type, insur premium, insur Coverage, bus start, bus endl 
EPROM insur policy 
HABERE a&cce no = 1001 
ORDER BY @CE NO, DUS SIT 


ACC NO INSUR TYPE INSUR PREMIUM INSUR COVERAGE BUS START BUS END 
1001 A01 1200.00 AN OOO E 0 0 (OHIO, 
1001 A01 2000.00 0 
1001 A01 1200.00 O00 


3 record(s) selected. 


这 里 时 间 段 的 语义 仍然 是 半 开 区 间 ,，“ 含 头 不 含 尾 ”"， 即 bus start 包含 在 有 效 业 务 时 
间 段 内 ， 但 bus end 不 包含 在 内 。 


(3) 删除 应 用 时 态 数 据 
删除 应 用 时 态 表 的 数据 与 更 新 操作 类 似 ， 可 以 用 普通 的 DELETE 语句 ， 也 可 以 用 FOR 
PORTION OF BUSINESS TIME 子 句 限定 删除 操作 的 时 间 范 围 。 
如 下 所 示 的 DELETE 语句 取消 帐号 1001 在 2010 年 7 月 1 日 到 2011 年 7 月 1 日 的 保险 ， 
从 结果 中 可 以 看 到 ， 相 应 时 间 段 的 业务 数据 已 经 被 清除 。 
DELETE EROM insur policy 


FOR PORTION OF BUS LNESS TME FROM '2010-07-01' TO '2011-07-01' 
HABERE cue no = 1001 2 
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SELECT suele. no, insur type, insur premium, insur Coverage, bus start, bus endl 
EROM insur policy 
HEBRE a&cce no = 1001 
ORDER BY @ce no, OUS STaArT ; 


ACC NO INSUR TYPE INSUR PREMIUM INSUR COVERAGE BUS START BUS END 
1001 A01 1200.00 0 
1001 A01 2000- 00 2H0,101010)(0: 10/0108 0140/3 0/82: (0) B1) 0 017200 
1001 A01 B20 0 OO OT O E O 


3 record(s) selected. 


3. 查询 应 用 时 态 数 据 


对 应 用 时 态 表 ， 可 以 使 用 基本 的 SELECT 语句 ， 也 可 以 使 用 新 的 时 态 条 件 谓 词语 法 ，DB2 
提供 了 下 面 3 种 新 的 时 态 语法 : 
(1) FOR BUSINESS TIME AS OF… 个 时 间 点 的 业务 数据 。 
(2) FOR BUSINESS TIME FROM begin TO end: 查询 zz. 
(3) FOR BUSINESS TIME BETWEEN begin AND end: 查询 时 间 点 从 begin 到 end 的 有 
效 业 务 数据 。 访 语法 是 财 区 间 ，“ 含 头 含 尾 ”， 指 定 的 开始 和 结束 时 间 都 包含 在 时 间 段 内 。 
使 用 时 态 条 件 查 询 应 用 时 态 表 的 例子 如 下 所 示 : 


SELECT ue No, insur type, insur premium, insur COverage, bus start, bus ne FROM 


insur policy 


ACC NO INSUR TYPE INSUR PREMIUM INSUR COVERAGE BUS START BUS END 
1001 A01 2000.00 人 
1002 A02 2000.00 人 
1003 A01 800.00 15219 0110/18/10) O (9€ (9) (009/419) E790, LE 
1004 B02 6000.00 0 
1001 A01 1200.00 0 
1001 A01 1200.00 2 


6 record(s) selected. 


SELECT &ce_ no, insur type, insur premium, insur cCoyvysrage, bus start, bus encd! FROM 
insur policy FOR BUSINESS_TIME AS OF '2010-01-01' 


ACC NO INSUR TYPE INSUR PREMIUM INSUR COVERAGE BUS START BUS END 
1001 AOT 2000.00 RO OO O00 O O 
1002 A02 2000.00 人 


2 record(s) selected. 


SELECT uec no, insur type, insur premium, insur cCoysrage, bus start, bus encd FROM 
insur policy FOR BUSINESS TIME FROM '2009-06-01' TO '2010-02-01' 


ACC NO INSUR TYPE INSUR PREMIUM INSUR COVERAGE BUS START BUS END 
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1001 A01 2000.00 1 
1002 A02 2000.00 人 
1001 A01 1200.00 220)810:100) TORTE T VILIA 2080/8. T O TU 


3 record(s) selected. 


SELECT sued. no, insur type, insur premium, insur Coverage, bus start, bus encd FROM 


insur policy FOR BUSINESS_TIME BETWEEN '2009-06-01' AND '2010-02-01' 


ACC NO INSUR TYPE INSUR PREMIUM INSUR COVERAGE BUS START BUS END 
1001 A01 2000- 00 21010101019: OOO Ol a O HO) 2010 
1002 A02 2000. 00 0 
1003 A01 800.00 有 
1001 A01 1200.00 0 


4 record(s) selected. 


4.4.4 NAR 


DB2 还 文 持 双 时 态 表 ， 它 将 二 者 的 优势 结合 在 一 起 。 例 如 ， 使 用 应 用 时 间 来 管理 保单 的 有 
效 期 ， 使 用 系统 时 间 来 跟踪 事务 对 这 些 保 险 单 所 做 更 改 的 历史 记录 和 时 间 崔 ， 使 用 应 用 时 间 来 
管理 贫 蒜 的 期 限 ， 使 用 系统 时 间 来 跟 踩 贷 秋 帐号 所 做 更 改 的 历史 记录 和 时 间 。 

创建 双 时 态 表 时 需 包括 系统 时 态 表 需 要 的 3 个 时 间 字 段 和 应 用 时 态 表 需 要 的 2 个 时 间 子 
段 ， 同 时 建立 相应 的 历史 表 并 与 基础 表 关 联 ， 这 样 ， 通 过 双 时 态 表 可 以 轻松 管理 系统 时 间 和 应 
用 时 间 。 例 如 ， 为 贫 丈 帐户 创建 双 时 态 表 的 语句 如 下 所 示 : 


CREATE TABLE loan account | 
account no INTEGER NOT NULL, 


lose epe VARCHAR(10), 
interest DECIMAL(5,2) NOT NULL, 
balance DECIMAL (10,2), 
bus Starr DATE NOT NULL, 
bus enel DATE NOT NULL, 
SYS Start TIMESTAMP (12) NOT NULL 
GENERATED ALWAYS AS ROW BEGIN IMPLICITLY HIDDEN, 
sys le TIMESTAMP (12) NOT NULL 
GENERATED ALWAYS AS ROW END IMPLICITLY HIDDEN, 
crans Start TIMESTAMP (12) 


GENERATED ALWAYS AS TRANSACTION START ID IMPLICITLY HIDDEN, 
PERIOD SYSTEM TIME (sys _ Start, Sys enc), 
BERIOD BUSINESS TIME (us Starct, OE E 
PRIMARY KEY (account No, BUSINESS TIME WITHOUT OVERLAPS) 


CREATE TTABER Toana CC Ouni TaI ory 


LIKE loan &ccount? 


ALTER TABLE loan account 
ADD VERSIONING USE HISTORY TABLE loan account edge sae Ore ; 
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XX IS] ze de ER] e lE Eg 8 ERANA KMAMAR RES, XCHUTMS BREED. 
4.4.5 ”将 普通 表 转 换 为 时 态 表 


如 末 一 个 表 是 普通 表 ， 现 在 希望 把 它 转 换 为 时 态 表 ， 如 何 实 现 呢 ?其 实 ， 不论 转 换 为 系统 
时 态 表 还 是 应 用 时 态 表 ， 转 换 的 方法 都 是 类 似 的 ， 而 且 由 于 应 用 时 态 表 没有 历史 表 ， 所 以 转换 
更 容易 些 。 

根据 目标 表 是 否 有 时 间 衬 段 ， 可 以 分 为 以 下 两 种 情况 : 

CIO 如 采 现 有 的 表 没 有 时 间 有 字段， 那么 可 以 使 用 ALTERTABLE 语句 回 该 表 添 加 必需 的 
时 间 宇 段 、 时 间 段 和 历史 表 ， 并 将 历史 表 和 基本 表 关 联 。 

2) 如 果 已 经 有 了 一 僚 实 现 版 本 控制 的 机 制 ， 即 基本 表 已 包含 时 间 字 段 并 定义 了 相应 的 
历史 表 ， 对 基本 表 的 版 本 控制 逻辑 由 触发 右 实 现 。 这 时 ， 只 需 执 行 ALTER TABLE 语句 基于 现 
有 的 两 个 时 间 字 段 增 加 一 个 SYSTEM_TIME 时 间 段 的 定义 ,保留 历史 表 , 并 用 ALTER TABLE 
语句 将 历史 表 和 基本 表 关 联 ， 最 后 删除 原来 的 触发 器 。 

接 下 来 ， 通 过 一 个 例子 来 说 明 一 下 第 (2) 种 情况 下 的 具体 转换 步骤 ， 为 了 方便 起 见 ， 触 
发 器 相关 内 容 省 略 。 下 面 是 表 stock 和 历史 表 stock history 的 DDL 定义 ， 都 已 经 有 了 两 个 时 间 
字段 ， 分 别 为 Sys start 和 sys end: 


CREATE TABLE stock ( 


account no INTEGER NOT NULL, 

cuoc NO INTEGER NOT NULL, 
shares DECIMAINm(UE5,L2) NO NU 
cy cec ET TIMESTAMP (12) NOT NULL, 
sys _ endl TIMESTAMP (12) NOT NULL 


) 

CREATE TABLE stOCk history LIKE StOGkR $8 

Hc. H ALTER TABLE 语句 将 stock 表 中 的 sys start 和 sys end XX P^ GA SERE [RI E 
修改 为 “GENERATED AS ROW BEGIN" fll “GENERATED AS ROW END”， 并 基于 这 两 个 


时 间 字 段 定 义 一 个 SYSTEM TIME 时 间 段 。 然 后 ， 在 stock 表 中 添加 trans. start 字段 记录 当前 
行 数据 变化 的 事务 开始 时 间 ， 相 应 的 ， 在 历史 表 stock. history PERIZ TFE - 


ALTER TABLE STOCK ALTER COLUMN 57S STATT 
SET GENERATED AS ROW BEGIN ; 


ALTER TABLE STOCK ALTER COLUMN sys endl 
SET GENERATED AS ROW END ; 


ALTER TABLE STOCK 
ADD PERIOD SYSTEM TIME (SYS start, sys end) p; 


ALTER TABLE stCOCk ADD COLUMN trans start TIMESTAMP (12) 
GENERATED AS TRANSACTION START ID 


IMPLICITLY HLIDDEN T 


ALTER TABLE StOCGk hnistory 
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ADD COLUMN trans Start TIMESTAMBP(L12) 
IMPLICITLY HIDDEN 2 


最 后 ， 使 用 ALTER TABLE 语句 将 历史 表 stock history 和 基本 表 stock 关联 ， 从 而 局 用 版 
本 控制 。 


ALTER TABLE stock 
ADD VERSIONING USE MISTORY TABLE STOCK ligtOry P 


XIE, MERTI —7h CER Ze) 38 EISE AIT T d 


4.5 SES5|i&ibtie — dH EE, Reim 


当 问 起 一 些 从 事 性 能 优化 工作 的 朋友 ，SQL 性 能 优化 中 有 哪些 重要 的 因素 ? 许多 人 首 推 索 
g|. ZEH, RIA A PETERET dm XU! 索引 对 性 能 有 这 么 重要 的 有 影响， 那么 索引 如 何 
实现 ? 这 应 该 是 大 家 都 想 了 解 的 一 个 问题 。 


对 他 们 的 数据 库 系统 进行 优化 于 是 ， 在 重要 领导 访问 的 前 夕 ， 我 来 到 了 美丽 的 杭州 ， 
去 从 事 秘 密 的 地 下 优化 工作 ， 

| 记得 就 是 为 一 个 频繁 调用 的 SQL 语句 创建 了 索引 ， 现 在 已 经 记 不 清楚 细节 了 ， 竟 然 取 
| 得 了 明显 的 效果 : 前 端 应 用 的 响应 时 间 从 20s 下 降 为 5s! 

(窗户 得 知 效果 后 非常 开心 ， 这 下 重要 领导 视察 的 时 候 就 会 非常 满意 了 。 但 是 ， 我 这 里 
| 需要 提醒 广大 DBA 的 是 : 性 能 优化 是 面向 最 终 用 户 的 ， 不 是 给 领导 看 的 。 


4.5.1 DB2 索引 长 什么 样 


索引 其 实 很 简单 ! 很 好 理解 。 

索引 好 比 书 的 目录 。 试 想 一 下 在 网 书馆 碍 资料 时 ， 如 采 不 能 按照 目录 检索 ， 我 们 将 不 得 不 
翻阅 所 有 的 书籍 ， 那 么 必 将 陷入 活 瀚 的 文子 海洋 中 。 与 此 类 似 的 ， 如 果 没 有 合理 的 索引 ， 那 么 
DB2 引 敬 将 不 得 不 扫 揪 全 表 ， 这 童 味 看 资源 和 时 间 的 大 量 消耗 。 

那么 ， 在 DB2 中 ， 索 引 是 如 何 实现 的 ? 答案 是 以 B+ 树 为 基础 实现 的 。 

B+ 树 是 用 来 建立 索引 的 一 种 基本 形式 , 它 的 叶子 节操 上 指 问 记 录 的 一 系列 指针 可 以 起 到 还 
速 找到 数据 的 作用 。 如 图 4-3 所 示 ，B+ 树 能 目 动 保持 与 数据 文件 大 小 相 适应 的 索引 层次 ， 其 节 
ATAZA, ROM. "BIRD SOBUHCYU Hi. PAEA HT RAEM, FEA SK 
际 的 数据 行 。 
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CA) (CD) CE CN c CT’) (DHK) 中 间 节 点 


CE i ] 


其 中 : DHE-Dummy High Key 
图 4-3 DB2 B+ 树 索引 


对 于 给 定 的 键 值 ， 在 BHAE REKER TETA -AW HAR Aa REHE wh 
地 址 CRID) ， 时 间 复 杂 度 为 O(LOG(n). n 为 键 值 的 数目 。 

数据 行 的 地 址 都 存储 在 叶子 节点 。 如 图 4-4 所 示 ， 叶 子 页 的 头 部 有 一 个 槽 目录 ， 模 目录 的 
每 一 个 条 目 都 是 一 个 索引 项 ， 它 保存 了 该 项 的 键 值 以 及 相应 的 记录 RID。 碳 边 的 页 为 数据 页 ， 
每 个 数据 页 开头 都 有 一 个 页 头 。 在 页 头 后 面 ， 也 有 一 个 槽 目录 ， 模 目录 的 每 一 个 条 目 都 与 该 页 
中 的 一 个 记录 相对 应 。 该 条 目 本 身 是 数据 页 中 记录 开始 位 置 的 字 节 位 移 ， 值 为 一 1 的 条 目 表 示 
已 删除 的 记录 。 


中 间 节 点 中 间 节 点 "p qa x 


RID-(Page,Slot) 


E 4-4 DB2 索引 内 部 结构 图 


Data Record 


在 B+ 树 结构 中 ， 还 需要 将 前 后 叶子 节点 连接 起 来 ， 以 方便 RID $445. «518m T 5 rob 
mA HAERE EAER EAH. AER] CREATE INDEX 语句 中 的 ALLOW 
REVERSE SCANS FHK AHR HRI HH, WRI J DISALLOW REVERSE SCANS, H% 
4 Bede UE. ATN T, RI AFI m. É] 4-5 AA R YAA RAH 
针 情 况 。 

索引 的 叶子 是 按照 键 值 的 顺序 依次 排列 的 ， 而 双向 索引 同时 包括 两 个 方向 的 叶子 节点 的 指 
针 ， 指 向 左边 的 和 右边 的 邻居 叶子 页 。 因 此 ， 双 问 索 引 可 以 用 来 从 正 癌 或 有 反 和 疝 (升序 或 降序 ) 
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扫描 。 -— 
聚集 索引 是 一 类 特别 的 索引 ， 它 要 求 物 

理 存储 中 的 数据 行 顺序 与 索引 中 的 RID 顺序 

是 对 应 的 。 在 一 个 表 中 可 以 存在 多 个 非 聚 集 


索引 ， 但 是 只 能 存在 一 个 聚集 索引 。 如 图 4-6 
显示 了 聚集 索引 和 非 聚 集 索 引 的 区 别 。 对 于 
聚集 索引 ，DB2 尝试 按照 相应 的 键 在 索引 页 
中 的 出 现 顺 序 把 数据 保存 在 数据 页 中 ， 这 样 Er 
非常 便于 预 取 操作 的 执行 ， 从 而 提高 vo 性 三 i - 三 x - EB E 


图 4-$ ”双向 索引 


能 .可 以 用 CREATE INDE 语句 的 CLUSTER 
子 句 来 创建 聚集 索引 , 在 小 数据 类 型 (比如 INTEGER) 上 或 是 查询 中 频繁 用 于 范围 搜索 的 字段 
上 建立 聚集 索引 。 


JER SERI ARX | 


从 上 面 可 以 看 出 ， 索 引 的 实质 是 以 增 大 存储 空间 为 代价 来 减少 WO， 它 基于 B+ 树 的 结构 具 
有 下 面 3 个 特点 : 
e B+ 树 结构 : 查找 树 型 结构 的 时 间 复 杂 上 度 为 OLOGO), HERH F NAR A E a 
Z O(n) ZSEDURZ. 
e 包含 数据 : 索引 上 还 包含 索引 衬 段 的 数据 ， 在 组 合 索引 情况 下 ， 如 末 SQL 语句 只 引用 
了 索引 上 的 字段， 那么 不 需要 访问 表 数 据 束 可 以 得 到 查询 结 果 。 
e WU HH: 索引 的 键 值 是 按 大 小 顺序 排列 的 ， 这 不 仪 能 加 快 但 询 速 度 ， 而 且 还 可 以 为 
SOL 语句 中 的 Order By 和 Group By 子 句 服务 ， 从 而 避免 排序 。 
4.5.2 为 了 性 能 设计 索引 
在 什么 条 件 下 DB2 会 访问 索引 呢 ? 这 是 由 优化 器 根据 SQL 语句 的 where 条 件 决 定 的 .where 
条 件 在 DB2 中 被 称 为 谓词 ,如 图 4-7 所 示 , 谓词 主要 有 四 其 , 分 别 是 范围 定 界 (Range-Delimiting )、 
索引 控制 (Index-Sargable) 谓词 、 数 据 控制 (Data-SARGable) 谓词 和 保留 (Residual) 谓词 ， 
下 面 是 它们 的 具体 解释 。 
e Range-Delimiting 谓词 用 于 限制 索引 扫描 的 范围 ， 它 们 提供 了 索引 扫 摘 的 起 止 位 置 。 
e Index-Sargable 谓词 不 是 用 来 限制 搜索 的 范围 ， 但 由 于 谓词 中 的 字段 是 索引 的 一 部 分 ， 
所 以 可 以 从 索引 中 估计 出 来 。Imdex-sargable 会 减少 访问 基 表 的 页 的 数目 。 但 是 并 不 能 
减少 索引 页 的 访问 量 。 这 两 类 谓词 一 般 为 “=”“>”“<” 每 谓词 。 
e Data-SARGable 谓词 ， 索 引 省 理 帮 无 法 起 作用 ,但 是 数据 定理 服务 可 以 进行 条 件 过 小 。 
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通常 ， 这 些 谓 词 需 要 访问 基 表 。 具 有 代表 性 的 有 “<>”、“LIKE” 等 。 
e Residual 谓词 的 性 能 是 最 差 的 ,所 需 的 VO 操作 非常 大 ,已 经 超过 了 对 基 表 的 访问 成 本 。 


Residual 谓词 的 例子 包括 关联 子 碍 询 ， 使 用 ANY. ALL. SOME 或 IN FEW, sk 
读 取 LONG VARCHAR 或 是 LOB 数据 等 。 


Index Manager 


Range-delimiting 谓词 Range-delimiting: tart 
si un Index EMT AS 


i 
Index-sargable 谓词 。 多 个 = 加 上 >< Stop 


Data Management Services(DMS) 


E <> 
Sargable 谓词 « [ike oe 


Relational Data Services(RDS) 


. 'EH ppr: m . 
Residual 谓词 (any, all, some, in) 


" | ong varchar 等 数据 类 型 


上 -| 
最 好 性 能 最 坏 
图 4-7 谓词 分 类 与 处 理 


人 注意 : 合理 的 索引 也 能 为 多 表 关 联 提供 便 
如 果 是 多 表 连 接 SQL 语句 ， 在 内 表 ( 也 称 为 被 驱动 表 ) 的 连接 字段 创建 索引 ， 也 能 
在 大 部 分 情况 下 提高 性 能 。 读 者 可 以 参考 本 书 第 9 章 相 关内 容 ， 


个 设计 合理 的 索引 ， 可 以 避免 全 表 扫 描 、 实 现 全 索引 访问 、 避 免 一 定 程度 的 排序 ， 了 最 终 
取得 性 能 的 提高 。 下 面 举 例 说 明 。 
1. 避免 全 表 扫 搞 


当 DB2 执行 一 个 SQL 语句 时 ， 优 化 器 会 按照 它 的 评估 模型 ， 对 满足 查询 要 求 的 各 种 方案 
的 执行 成 本 进行 评估 。 最 后 ， 优 化 器 会 选择 一 个 最 优 的 访问 计划 ， 访 问 计 划 指 定 了 各 个 操作 的 
顺序 。 访 问 一 个 表 中 的 数据 有 两 种 办 法 : 

e 全 表 扫 描 : 通过 顺序 扫描 整个 表 ，DB2 会 依次 访问 表 中 的 每 一 行 。 

e RAH: 首先 访问 表 上 的 索引 得 到 某 一 行 的 RID， 然 后 再 从 基 表 中 访问 该 行 。 

可 以 从 访问 计划 中 判断 是 全 表 扫 搬 还 是 索引 扫描 ,例如 ,对 于 SQL 语 句 “select acct id, name 

from acct where balance >25000”， 下 和 面 显 示 了 它 的 访问 计划 ， 可 以 看 到 对 表 ACCT 进行 

全 表 扫 描 ， 总 成 本 为 11421.2: 


Original Statement: 


select acct id, name 
OMEC 
where balance > 23000 


Access Plan: 


Total Cost: 11421.2 
Query Degree: ll 
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ROWS 
RETURN 
(I) 
COST 

I/O 

| 
5263,16 
TBSCAN 
T, 
11421,2 
2059 

| 
100000 

TABLE: DB2ADMIN 

ACCT 


通常 ， 全 表 扫 描 需 要 更 多 的 IO 资源 和 缓冲 区 空间 。 为 了 避免 全 表 扫 描 ， 需 要 对 关键 SQL 
语句 进行 分 析 , 然后 在 相应 的 表 上 建立 适当 的 索引 。 分 析 上 面 的 这 条 SQL 语句 , 可 以 在 表 ACCT 
的 字段 BALANCE 上 建立 如 下 索引 : 


GE 


于 是 ，DB2 在 处 理 这 条 SQL 语句 时 将 用 到 新 建 的 索引 ， 相 应 的 访问 计划 如 下 所 示 ， 可 以 
看 到 索引 扫描 提升 了 和 查询 性 能 ， 总 成 本 从 11421.2 降 为 1481.07: 


Access Plan: 
Total Cost: 1481.07 


Query Degree: 1 


Rows 
RETURN 
( — 1) 
COST 

15740. 

| 
5263.-16 
Eo E 
EST 
1481.07 


for 
5263.16 100000 
IXSCAN TABLE: DB2ADMIN 
( 3) ACCT 
$2 Rl Q1 
52 
| 
100000 
INDEX: DB2ADMIN 
IDX ACCT BALA 
Q1 
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人 注意 : 索引 扫描 并 不 一 定 是 最 好 的 
如 果 使 用 索引 扫描 的 成 本 


更 高 时 ， 优 化 器 会 选择 全 表 扫 描 。 通 第 下 面 几 种 情况 很 可 


能 会 使 用 全 表 扫 描 : 

(1) 表 很 小 : 直接 访问 表 并 不 需要 很 多 IO 开销 ， 比 通过 索引 扫描 然后 再 访问 基 表 
JF $ 4K. 

(2) 索引 聚集 度 很 低 : 导致 索引 扫描 后 访问 基 表 的 IO 增加 ， 或 者 列表 预 取 带 来 的 
排序 代价 过 高 。 


(3 ) 表 的 大 部 分 行 需要 被 访问 : Where 条 件 中 的 谓词 过 滤 度 低 ， 需 要 访问 表 的 大 部 
分 数据 ， 索 引 扫 描 没 有 好 处 。 


2. 实现 完全 索引 访问 


如 果 SQL 语句 所 需要 的 数据 全 部 在 茶 索 引 中 ,那么 瓯 没有 必要 访问 相应 的 基 表 了 ,这 束 是 
通常 所 说 的 完全 索引 访问 (Index-only Access? 。 

完全 索引 扫描 的 示例 如 下 所 示 ， 组 合 索 引 IDX ACCT GRP ID 创建 在 字段 ACCT. GRP 和 
ACCT ID 上 ,而 查询 语句 只 用 到 了 这 两 个 字段 ， 因 此 访问 索引 就 能 完成 查询 处 理 ,不 需要 访问 
基 表 。 


--8]$8 3x 9|-- 

CREATE UNIQUE INDEX IDX ACCT GRP ID ON ACCT 
(ACCT CRP ASC, 
eT 

-- 碍 询 语句 -- 

SELECT ACCT ID, ACCT GRP 

FROM ACCT 

WHERE ACCT GRP - 20; 


但 是 ， 如 果 SQL 涉及 的 字段 不 全 在 索引 中 ， 那 么 加 需要 从 基 表 中 访问 相应 的 行 。 例 如 ， 尽 
管 有 组 合 索引 IDX ACCT GRP ID. 仍然 需要 访问 基 表 来 获取 字段 ACCT NAME 和 ADDRESS 
的 数据 。 

SELECT ACCT ID, ACCT GRP, ACCT NAME, ADDRESS 


EROM ACCT 
WEERE ACCT GRE = 20; 


如 果 某 个 关键 SQL 语句 根据 唯一 索引 比如 主键 ) 来 检索 数据 ， 而 相应 表 的 字段 非常 多 ， 
这 时 可 以 使 用 索引 包含 列 〈include) 技术 ， 即 在 建立 唯一 索引 时 ， 将 SQL 涉及 的 字段 包含 到 索 
引 的 叶子 节点 中 。 这 样 ， 上 只 需 访 问 索 引 就 可 以 完成 处 理 ， 从 而 实现 完全 索引 扫 摘 。 

使 用 索引 包含 列 的 例子 如 下 所 示 , IDX ACCT UX 在 字段 ACCT. GRP 和 ACCT ID 上 具有 
唯一 性 ， 同 时 在 索引 的 叶子 节点 上 也 保存 了 学 段 ACCT NAME 和 ADDRESS 的 数据 。 这 样 的 
话 ， 下 面 的 查询 语句 只 需 访 问 索引 即 可 。 

-- 创 建 唯一 索引 ， 并 使 用 索引 包含 列 技 术 


CREATE UNIQUE INDEX IDX ACCT UX ON ACCT 
(ACCT GRP ASC, 
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ACCT TID DESC) 

INCLUDE (ACCT NAME ASC, ADDRESS ASC); 
-- 碍 询 语句 -- 
SELECT ACCT ID, ACCT GRP, ACCT NAME, ADDRESS 
FROM ACCT 
WHERE ACCT GRP - 20; 


3. 避免 排序 


我 们 从 上 一 市 了 解 到 , 索引 的 键 值 是 按 大 小 顺序 排列 的 , 这 样 一 来 不 仅 可 以 提高 查询 性 能 ， 
而 且 还 可 以 为 SQL 语句 中 的 Order By 和 Group By 子 句 利 用， 从 而 避免 排序 要 求 。 

比如 ， 下 面 的 SQL 语句 需要 按照 ORDER BY ACCT ID DESC 返回 降序 后 的 结果 ， 而 索引 
IDX ACCT GRP ID 是 按照 ACCT ID 降序 创建 的 , 所 以 可 以 从 索引 中 直接 获取 降序 后 的 续 
从 而 避免 显 式 的 排序 : 


--80g S SI-- 

CREATE UNIQUE INDEX IDX ACCT GRP ID ON ACCT 
(ACCT GRP ASC, 
ACCT ID DESC); 

SELECT ACCT ID, ACCT GRP, ACCT NAME, ADDRESS 

FROM ACCT 

WHERE ACCT GRP - 20 

ORDER BY ACCT ID DESC; 


在 东航 空 公司 数据 库 性 能 调 优 中 ， 从 监控 中 发 现 ， 一 条 关键 SQL 执行 了 1765 1X. SQL 
语句 和 访问 计划 如 下 所 示 ， 它 需要 按 FLIGHTDEPARTURETIME 降序 返回 结果 ， 从 下 面 的 访问 
计划 可 以 看 出 ， 做 了 显 式 的 排序 ， 总 成 本 为 223.786: 


SELECT CUZ “FLIGATDETALLIDENTIFIER”" AS YFLIGAHTDETAILIDENTIPIER", 
O2 o VFLIGATIDENTIFIER” AS “FLIGHTIDENTIFIER", Q2 "FLIGHTDEPARTURETIME ” 
AS “ELIGHTDEBPARIURETIME. 

FROM DB2ADMIN.FLIGHTDETAILHISTORY AS Ql, DB2ADMIN.FLIGHTDETAILHISTORY AS Q2 

WHERE (Q2. "FLIGHTDETAILIDENTIFIER” = O01."FLIGHLTDETAILIDENTIEFIER") AND 
(Q2."MATCHREQUIRED" = 'Y') AND (Q2."FLIGHTDEPARTURETIME" <= 
2012=08=30=14,.23.00.000000") AND (2012-=08=30-=04,.23.00.000000" < 
O2 o "FLIGHTDEBARTURETIME”) AND (Q2. "FLIGHATNUMBER” = “CDG4722 13) 
AND (Q2."RECORDTYPE" = YRF”) AND (Q2."RECORDSTATUS" = 'MA') AND 
(O2 o "FLIGAĦTIDENTIFIER" <> 0) 

ORDER BY Q2."FLIGHTDEPARTURETIME" DESC 


Access Plan: 
Total Cost: 223.786 
Query Degree: 1 


ROWS 
RETURN 
( 1) 
COSE 
I/O 
| 
ZUM medien) 
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TBSCAN 
(2) 
223- 186 
TAS 
| 
2. 0595436=-005 
SORT 
(9 
223- 186 
TSITAS 
| 
2. 099436=005 
FETCH 
($9) 
223°- 185 


456 c 56 1.59032e4007 
RIDSCN TABLE: DB2ADMIN 
( 5)  FLIGHTDETAILHISTORY 
2.9) Q246 
Sc IETDIEAES 
| 
456.361 
SORT 
( 6) 
299.0 dS 
A 
| 
456.361 
IXSCAN 
( v) 
2 5 
A 
| 
1.59032e4007 
INDEX: DB2ADMIN 
X5ACPR37 32 


于 是 检查 索引 X5ACPR37_32 的 定义 ， 如 下 所 示 ， 了 字段 FLIGHTMOVEMENTTIME 没有 起 
到 任何 作用 。 于 是 为 该 关键 SQL 新 建 索 引 X6ACPR37 32， 将 字段 FLIGHTDEPARTURETIME 
包含 在 新 创建 的 索引 中 。 从 新 的 访问 计划 可 以 看 出 ， 显 式 的 排序 操作 因为 这 个 索引 的 出 现 而 消 
除了 ， 碍 询 的 总 成 本 从 223.786 减少 到 了 22.7008， 降 低 了 10 倍 左右 。 


--JEvti *& SI SR SI 

CREATE INDEX “DB2ADMIN",. “XS5ACPR3Y 32 ON “DB2ADMINY, "ELIGHTDETALLALSTORY™ 
("PLIGATNUMBER" ASC, 
DEENGHTMOVEMIED TIMES ASC) 

-- 修 正 后 的 新 索引 

CREATE INDEX “DBZ2ADMIN” , “XG6ACBPR3Y 32 ON “DB2ADMINY. “FLIGHTDETATLAISTORY" 
("PLIGATNUMBER" ASC, 
"FLIGHTDEPARTURETIME" DESC) 
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-- 新 索引 后 的 访问 计划 

Access Plan: 
Total Cost: 22.7008 
Query Degree: 1l 


Rows 
RETURN 
( 1) 
COST 
17/8; 
| 
2- 059436=-005 
PETCH 
( 2) 
222 1006 
3.00003 
= wisis 3 
2586961@=005 1559032604007 
IXSCAN TABLE: DB2ADMIN 
( 3) ED E THTSPORY 
22.7004 
3 
| 
1 .59032e+007 
INDEX: DB2ADMIN 
X6ACPR37 32 


4.5.3 ”吃透 组 合 索 引 


单字 段 索 引 好 ， 还 是 组 合 索 引 好 ? 这 是 很 多 设计 人 员 经 党 喜欢 问 的 问题 ， 这 个 其 实 需要 辩 
证 去 看 。 大 多 数 情 况 下 ， 组 合 索 引 比 单字 段 索 引用 途 广 ， 但 是 其 内 部 原理 复杂 。 用 好 了 组 合 索 
引 ， 能 极 大 提升 系统 性 能 ， 用 不 好 反而 对 DB2 KERR. 

组 合 索 引 之 所 以 复杂 ， 束 在 于 字段 排序 不 是 随意 指定 的 ， 而 是 有 两 个 重要 原则 ， 一 个 是 前 
绥 性 ， 一 个 是 可 选 性 。 我 见 过 很 多 设计 人 员 ， 发 现 他 们 没有 意识 到 应 该 优先 设计 组 合 索 引 ， 更 
没有 充分 理解 组 合 索引 的 这 两 个 重要 诛 则 。 

下 面 我 们 重点 探讨 一 下 这 两 个 主要 原则 : 

第 一 个 原则 : 前 级 性 CPrefixing) ， 只 有 第 一 个 字段 作为 过 滤 条 件 ， 有 索引 才 会 局 用 。 

不 论 单字 段 索 引 还 是 组 合 索引 , 它们 在 DB2 内 部 都 是 有 序 的 。 如 下 数据 所 示 , 如 果 在 部 门 、 
姓名 和 年 龄 这 样 的 字段 顺序 建立 索引 〈dept name, age) ， 那 么 先 按照 部 门 排序 ， 再 按照 姓名 排 
序 ， 最 后 按照 年 龄 排序 。 如 果 按 照 部 门 租 询 ， 索 引 肯 定 能 用 上 ， 但 如 果 只 给 出 姓名 进行 得 询 ， 
那么 DB2 就 成 了 无 头 爷 蝎 ， 不 会 使 用 该 索引 了 ， 就 变 成 全 表 扫 描 了 。 


部 门 Cdept) 姓名 (name) 年 龄 Cage) 
信息 技术 部 张扬 48 
信息 技术 部 o S 34 
运 维 文 撑 部 E 26 
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运 维 文 撑 部 SEE 3/5 


第 二 个 原则 ， 选 择 性 〈selectivity) 强 的 字段 放 在 前 面 。 

组 合 索 引 中 如 何 排列 字段 顺序 ? DB2 建议 按照 选择 性 的 强 弱 排序 ， 选 择 性 强 的 即 字 段 值 多 
的 排 在 前 面 ， 从 而 可 以 提高 得 询 性 能 。 按 照 这 个 原则 ， 上 例 中 同一 个 部 门 的 记录 显然 残 太 多 了 ， 
共有 相同 姓名 的 却 上 只 有 1 个 或 几 个 ， 所 以 按照 这 个 原则 上 面 组 合 索引 的 字段 顺序 应 为 Cname, 
age，dept) 。 

不 过 ， 这 两 个 原则 有 时 会 冲突 ， 束 应 该 综合 考虑 。 比 如 ， 要 创建 字段 name 和 dept 上 的 组 
fr Bix name 列 的 基数 是 100000，dept 列 的 基数 是 300。 根 据 第 二 个 原则 ， 这 个 组 合 索 
引 应 当 为 CGname, dept) 。 但 是 ， 如 有 果实 际 的 应 用 程序 中 ， 得 询 条 件 中 单独 使 用 dept 字段 的 频 
率 为 73%， 单 独 使 用 name 字段 为 5%， 同 时 使 用 dept M name 字段 为 20%。 绽 合 考虑 ， 组 合 索 
引 就 应 该 是 (dept, name) . 

对 很 多 读者 来 襄 ， 真 正 理解 上 和 面 两 个 原则 并 不 容易 ， 下 面 就 以 不 同 的 where 条 件 为 例 来 继 
续 解 读 组 合 索引 (name. age. dept) 的 用 法 。 

(1) name = ' 张 平 'and age = 35 and dept=' 运 维 文 撑 部 ' 

这 时 ， 这 三 个 字段 上 的 谓词 均 可 作为 范围 定 界 谓词 。 

(2) name = ' 张 平 'andage> 32 and dept = ' 运 维 文 撑 部 ' 

首先 ，name = ' 张 平 ' 可 以 作为 范围 定 界 谓词 ， 因 为 name 是 组 合 索引 的 第 一 个 字段 。 

其 次 ，age > 32 也 可 以 作 范 围 定 界 谓词 ， 因 为 组 合 索 引 中 age 前 面 的 字段 只 有 name, m 
name 上 正好 有 等 于 谓词 。 

最 后 ，dept = ' 运 维 文 撑 部 ' 不 能 作为 范围 定 界 谓词 ， 因 为 组 合 索引 中 ，dept 前 面 的 学 段 age 
大 于 谓词 。 不 过 ，dept = ' 运 维 文 撑 部 '， 可 以 作为 Index-Sargable 谓词 ， 从 而 可 以 利用 索引 叶子 
节点 上 的 数据 进行 计算 。 

NAN ex Jump Sc: 
当然 ，DB2 VIO 中 增强 的 index jump scan 技术 ， 通 过 枚 举 所 有 age > 32 的 age 值 ， 
将 dept = ' 运 维 支撑 部 ' 包 含 为 范围 定 界 谓词 ， 来 构建 新 的 索引 查找 区 间 。 如 果 age > 32 
的 age 值 数目 较 少 ， 那 么 这 个 技术 会 很 有 用 。 


(3) name = ' 张 平 'and dept = ' 运 维 支 撑 部 ' 
这 时 , name = ' 张 平 ' 可 以 作为 范围 定 界 谓词 , 但 是 dept ^ ' 运 维 文 撑 部 ' 只 能 作为 Index-Sargable 
谓词 ， 因 为 where 条 件 中 没有 age 字段 的 谓词 。 
请 参考 452 节 最 后 提 到 的 SQL 语句 ， 理 解 为 什么 谓词 '2012-07-01-00.00.00.000000' < 
QI.ENDDATE 只 能 作为 Index-Sargable 谓词 ， 而 不 能 作为 Range-Delimiting 谓词 。 


/A 注意: 不 等 谓词 的 限制 条 件 


如 果 一 个 字段 上 的 条 件 为 不 等 谓词 (比如 <、>、<= 和 >=)， 那 么 这 个 字段 前 面 的 所 有 
字段 必须 都 为 等 于 (=) 条 件 ， 这 个 字段 才能 作为 范围 定 界 ( Range-Delimiting ) 谓词 。 


再 回 到 本 市 开头 提 a 到 的 问题 ， 蛙 子 段 索引 好 ， 还 古 组 合 罕 引 好 ? 组 合 索引 的 学 段 顺序 如 何 
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安排 ? 读者 可 以 参考 下 面 的 建议 : 
(1) 设计 组 合 索引 的 时 候 ， 要 重点 孝感 前 缀 性 原则 ， 只 有 索引 中 的 第 一 个 子 段 作为 过 沽 
ATE. VHS SH. 
(2) HX, BARRE, RERE, DC DEGERE. DE T 
(3) 分 析 where T-FJBEUE ARTE, WRR ER E WEA EEH R] 
(4) WB rEDGEÉESEE-— TED, shwIeXSTETEdBGScmW] Ex. BEIER A e 
REE, (BAR EREEREER. nIUAEEMRS BREUI IUPÉRIULBETKAL TIER IIIA e 
(65) 如 果 过 滤 条 件 涉及 到 的 字段 不 国定， 组 合 也 比较 灵活 ， 则 分 别 建立 单字 段 索引 。 
(6) 如 条 是 多 表 连 接 SQL 语句 ， 可 以 在 内 表 (也 称 为 被 驱动 表 )〉 的 连接 字段 与 该 表 的 其 
f. 2 RA TEE BERE ETHER SI 


4.5.4 创建 索引 


上 面 介绍 了 如 何 设计 索引 ， 那 么 如 何在 DB2 中 创建 呢 ? 这 需要 使 用 “CREATE INDEX" 
语句 创建 ， 它 提供 了 多 种 选项 ， 主 要 包括 : 

(1) UNIQUE: 用 来 创建 唯一 索引 ， 有 索引 的 键 值 不 能 重复 。 

(2) PCTFREE: 每 个 叶子 节点 上 预 留 的 空 亲 空间， 默认 情况 下 PCTFREE 为 10. PCTFREE 
表示 索引 页 中 有 多 大 的 百分比 是 闲置 的 ,在 插入 新 的 行 和 更 新 索引 条 目 时 ，DB2 将 利用 这 些 空 
闲 空间 。 如 果 这 些 空间 被 填 满 ， 那 么 DB2 会 进行 索引 页 拆 分 操作 。PCTFREE 参数 的 设置 需要 
根据 数据 的 读 写 进行 区 分 ， 对 于 只 读 表 ， 可 以 将 PCTFREE 设 为 0; 对 于 聚集 索引 或 是 存在 大 量 
插入 操作 的 索引 ， 建 议 PCTFREE 值 设 的 更 大 一 些 。 

(3) ALLOW REVERSE SCANS: 默认 只 支持 对 索引 正 向 扫描 ，ALLOW REVERSE SCANS 
指定 该 索引 支持 正则 和 反问 扫描 。 

(4) INCLUDE: 在 唯一 索引 中 可 以 使 用 INCLUDE 子 句 将 其 他 没有 被 索引 的 字段 包含 到 
索引 叶子 市 点 中 ， 以 实现 完全 索引 访问 。 

(5) CLUSTER: 用 于 创建 察 集 索 引 ， 聚 集 索 引 人 允许 对 数据 页 采用 更 线性 的 访问 模式 ， 允 
许 更 有 效 的 预 取 ， 并 且 避 免 排序 。 

另外 ，DB2 除了 支持 关系 数据 上 的 索引 ， 还 能 为 XML 数据 和 文本 数据 建立 索引 。 

XML 索引 机 制 和 关系 型 数据 库 索 引 机 制 有 类 似 之 处 , 正如 在 关系 查询 中 一 样 , 索引 对 于 保 
证 XQuery 和 SQL/XML 的 性 能 是 至 关 重 要 的 。DB2 允许 在 XML 字段 上 定义 特定 于 路 径 的 
XML 索引 ， 这 意味 看 可 以 使 用 它们 来 案 引 频繁 在 谓词 和 连接 中 使 用 的 XML 元 素 和 属性 。 当 应 
用 程序 问 DB2 提交 关系 查询 或 XML 查询 时 ， 查 询 编 译 器 将 比较 查询 谓词 和 现 有 的 索引 定义 ， 
然后 确定 是 否 存在 可 用 索引 访问 。 

DB2 文本 数据 索引 的 建立 ， 主 要 是 为 了 对 长 数据 类 型 ， 包 括 字 符 串 类 型 、XML 类 型 和 大 
对 象 类 型 (LOB) 进行 文本 搜索 。 不 同 于 关系 型 数据 的 模糊 得 询 〈 例 如 like 子 句 ) ， 它 会 对 相 
应 的 文本 进行 分 词 处 理 ， 所 以 创建 索引 后 ， 用 户 只 需 很 短 的 时 间 就 可 以 从 索引 得 出 需要 搜索 的 
关键 学 ， 扩 展 了 数据 库 的 功能 。 


4.5.5 ”索引 的 常见 误区 


索引 是 把 双 刃 剑 ， 一 方面 发 挥 其 优势 ， 即 首先 要 定位 关键 SQL 语句 ， 分 析 这 些 SQL 语句 
的 特征 ， 然 后 根据 数据 的 实际 分 布 特征 建立 合适 的 索引 ， 并 确保 被 有 效 使 用 。 丸 一 方面 ， 不 能 
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忽视 索引 维护 的 成 本 ， 索 引 太 多 对 INSERT, UPDATE 或 DELETE 操作 频繁 的 数据 库 会 有 负面 
的 影响 。 
接 下 来 结合 某 航 空 公司 的 SQL 优化 实战 案例 ， 分 享 儿 个 常见 的 索引 使 用 误区 ， 以 给 读者 。 
1. 误区 一 : 索引 创建 了 就 一 定 会 启用 


索引 创建 了 并 不 代表 一 定 会 后 用 ， 例 如 有 的 索引 是 多 余 的 ， 碍 询 语句 不 可 能 用 到 ， 这 个 时 
候 ， 可 以 用 下 面 的 语句 碍 询 数据 库 中 从 未 使 用 或 者 很 久 没 使 用 过 的 宗 引 ， 其 中 LASTUSED ^£ 
段 表 示 该 索引 的 最 后 一 次 使 用 时 间 : 


select indschema,indname,tabname from syscat.indexes where LASTUSED-'01/01/0001' 


上 面 的 方法 只 有 在 DB2 V9.7 或 更 高 版 本 才能 使 用 ， 低 版 本 的 话 ， 可 以 使 用 db2pd 命令 来 
获取 ， 如 下 所 示 : 

db2pd -db sample -tcbstats index 

除了 多 余 索 引 没 有 用 到 外 ， 在 一 些 特殊 情况 下 会 出 现 索 引 抑制 现象 。 例 如 ， 在 flight date 
字段 上 创建 了 索引 ， 但 是 对 下 面 的 SQL 语句 仍然 无 法 启用， 依然 是 全 表 扫 描 ， 这 是 因为 索引 树 
中 是 flight date 的 值 ， 不 是 to_char(flight date) 的 函数 值 。 这 样 一 来 就 出 现 了 索引 抑制 ， 所 以 ， 
ANE A TE F E BU T DR ER C 


tO elatus (iligant Cate) between “2012=12=01" and) "2012=12=2® 


男 外 ， 尺 量 不 要 把 索引 字段 舱 入 到 表达 式 中 。 例 如 下 面 的 语句 ， 即 使 在 flight no 上 创建 索 
引 ， 也 不 会 局 用 索引 扫描 ， 原 因 是 索引 树 上 记录 的 是 fight_no， 而 不 是 flight no*6. 


人 


那么 ， 怎 么 解决 呢 ? 其 实 办 法 也 很 简单 ， 把 上 面 语句 改 成 下 面 的 代码 ， 这 样 就 能 司 用 索引 


flight OE A40 MG 
2. 误区 二 : 为 了 提高 查询 性 能 ， 同 时 创建 组 合 索引 和 单字 段 索 引 
当 一 个 表 上 索引 较 多 而 且 和 需要 优化 的 合 询 也 较 多 时 ， 丈 可 能 出 现 这 种 问题 ， 根 本 原因 还 是 


对 索引 机 制 了 解 不 够 深刻 。 在 某 航 空 公司 的 SQL 性 能 优化 中 , 正 是 为 了 优化 不 同 的 SQL， 就 出 
现 了 建 重复 索引 的 情况 。 如 下 所 示 ， 索 引 CHARGE DET SERVICECODE 是 多 余 的 。 


CREATE INDEX "DB2ADMIN"."CHARGEDE INDEX5" ON "DB2ADMIN"."CHARGEDETERMINATION" 
(Ce CODE ao 
"SERVICEPROVIDER" ASC, 
"ACTIVERECORD" ASC, 
"STARTDATE" ASC, 
"ENDDATE" ASC) 
CLUSTER ALLOW REVERSE SCANS; 
CREATE INDEX "DB2ADMIN"."CHARGE DET SERVICECODE" 
ON "DB2ADMIN"."CHARGEDETERMINATION" 
("SERVICECODBEUSASC) 
DISALLOW REVERSE SCANS; 
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实际 上 , 一 个 组 合 索 引 相当 于 多 个 索引 ， 如 索引 (A, B, C) 287b H?5 T (A). (A, B). (A, B, C) 
三 个 索引 。 这 也 是 在 SQL 语句 中 把 最 多 被 访问 的 字段 放 到 第 一 个 位 置 的 原因 ， 这 样 的 索引 就 能 
覆盖 更 多 的 查询 。 

3. 误区 三 : 组 合 索引 包含 的 字段 越 多 越 好 


持续 2 天 时 间 监 控 东 航空 公司 的 数据 库 ， 发 现 一 条 关键 SQL， 它 执行 了 129837486 K, Œ 
两 天 的 运行 中 ,在 这 条 SQL 上 总 执行 时 间 为 十 儿 个 小 时 。 当 问 起 这 条 SQL ESHS Y RSI, 
我 们 从 客户 那里 得 到 的 回答 是 肯定 的 。 这 条 SQL 语句 和 相关 索引 如 下 : 


select UNIQUEIDENTIFIER, FILEDFLIGHTRULES, AIRCRAFTUSAGE 

from DB2ADMIN.CHARGEDETERMINATION 

where activeRecord-'Y' and serviceCode-'DISP' and serviceProvider-'CATMBFE' 
ane STARTDATE < "2012=-07=01 00:00:00" anc! ENDDATE>"2012=-07=01 00:00:00" 

order by UNIQUEIDENTIFIER asc 


CREATE INDEX "DB2ADMIN"."CHARGEDE INDEX5" ON "DB2ADMIN"."CHARGEDETERMINATION" 
("SERVICECODE" ASC, 
"SERVICEPROVIDER" ASC, 
"ACTIVERECORD" ASC, 
vem RET S P 
"ENDDATE" ASC) 
CLUSTER ALLOW REVERSE SCANS; 


从 访问 计划 中 ， 确 实 也 发 现 这 条 SQL 用 到 了 该 索引 。 请 看 访问 计划 中 索引 扫描 中 的 谓词 处 
理 ，Start Key Predicate 和 Stop Key Predicate 对 心 4.5.1 方 提 到 的 Range-Delimiting 谓词 ， 而 
IXSCAN 操作 符 下 的 Sargable Predicate 对 应 Index-Sargable 。 但 是 仔细 分 析 ， 发 现 
ACTIVERECORD ='Y 和 STARTDATE <'2012-07-01-00.00.00.000000' 的 过 小 度 (Filter Factor) 
太 低 ， 分 别 为 0.969627 和 0.99888。 经 过 调查 ， 发 现 几 乎 所 有 的 相关 但 询 都 将 这 两 个 字段 的 谓 
词 计 算 为 TRUE。 那么 ， 把 这 两 个 字段 放 在 索引 字段 中 完全 没有 必要 ， 反 而 增加 了 索引 B+ 树 的 
大 小 和 层次 ， 影 啊 性 能 。 


5) IXSCAN: (Index Scan) 
2.2. 省略 无 基部 分 


Predicates: 


2) Start Key Predicate, 
Comparrson Operator: Equal (=) 
Subquery Input Required: No 
PLilter Pactor: 00.0114613 


Predicate Text: 


(Q1 .SERVICEPROVIDER = 'CATMBE ') 


2) Stop Key Predicate, 
Comparison Operator: Equal (=) 
Subquery Input Required: No 
Pilter Factors 0.0114613 
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Predicate Text: 


(QI .SERVICEPROVIDER = 'CATMBE ') 


3) Start Key Predicate, 
Comparison Operator: Equal (=) 
Subquery Input Required: No 
PLilter Factors 0.45788 


Predicate Text: 


(Ol cSEREVIOBECODE — JDESP 2 


3) Stop Key Predicate, 
Comparison Operator: Equal (2) 
Subquery Input Required: No 
BESTE 0.45788 


Predicate Text: 


(OT S EUVIOHECODEC— DISP 2) 


4) Start Key Predicate, 
Comparpsson Operator: Equal (=) 
Subquery Input Required: No 
Pilter eque 0.969627 


Predicate Text: 


(OL.ACTIVERECORD - 'Y') 


4) Stop Key Predicate, 
Comparison Operator: Equal (=) 
Subquery Input Required: No 
Pilter Factor: 0-969627 


Predicate Text: 


(Q1.ACTIVERECORD = 'Y') 


5) Sargable Predicate, 
Comparison Operators Less Than (<) 
Subquery Input Required: No 
Bep Pactor: U.S02292 


Predicate Text: 


("2012=07=01=00. 00 Ogre 1009,19. 0] < Q1 .BNDDATE) 
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6) Stop Key Predicate, 
Comparison Operator: Less Than («) 
Subquery Input Required: No 
PLilter Pactor: 0.99888 


Predicate Text: 


(QL.STARTDATE « '2012-07-01-00.00.00.000000') 
4. 误区 四 : 函数 索引 很 强大 ， 可 以 多 用 


佑 计 很 多 谈 者 熟悉 Oracle 有 的 冰 数 索引 ， 它 计算 函数 的 值 ， 随 后 将 最 终结 果 存 储 在 索引 中 。 
DB2 的 实现 机 制 不 同 于 Oracle， 它 是 创建 计算 列 用 来 存放 函数 产生 的 结果 ， 并 且 为 该 计算 列 创 
£l. 

在 下 面 的 DB2 例子 中 ,我 们 分 别 在 字段 first name. mid name 和 last name 上 调用 UPPER 
函数 并 创建 狐 的 字段 来 存放 UPPER 函数 计算 后 的 结果 。 为 了 提升 租 询 性 能 ， 又 为 新 产生 的 计 
算 列 upper first name, upper mid name 和 upper last name 特别 创建 了 两 个 索引 :这 up name 1 
和 ix up name 2。 语 句 如 下 所 示 : 


SET INTEGRITY FOR NAME OFF; 

ALTER TABLE name ADD COLUMN upper first name 
GENERATED ALWAYS AS ( UPPER(first name) )s 
ALTER TABLE name ADD COLUMN upper mid name 
GENERATED ALWAYS AS ( UPPER (mid name) ); 
ALTER TABLE name ADD COLUMN upper last name 
GENERATED ALWAYS AS ( UPPER(last name) ); 
SET INTEGRITY FOR name IMMEDIATE CHECKED FORCE GENERATED; 
CREATE INDEX ix up name 1 ON name 

(upper first name ASC, 

upper mic name ASC) > 

CREATE INDEX ix up name 2 ON name 

(upper last name ASC, 


upper mid name ASC) 2 


从 这 个 例子 可 以 看 出 , Æ DB2 PRRI AE A B] oen TAER M Hon A Wah 
的 计算 列 来 存放 ， 这 将 会 消耗 更 多 的 存储 空间 。 上 所 以 ， 建 议 尽 量 少 使 用 函数 索引 ， 而 是 将 函数 
进行 转换 。 

5. 误区 五 : 为 热 表 创建 的 索引 越 多 越 好 


一 个 热 表 有 48 个 字段 ， 插 入 、 更 新 和 删除 操作 非常 频繁 ， 但 是 其 上 竟然 创建 9 个 索引 ， 
从 而 导致 事务 吞吐 量 下 降 。 索 引 就 像 是 盐 ， 它 能 调味 ， 但 太 多 了 染 束 威 了 。 尽 管 多 建 索引 可 以 
优化 更 多 的 查询 ， 但 在 维护 索引 会 有 额外 开销 。 所 以 ， 一 般 建 议 OLTP 环境 ， 每 个 表 上 的 索引 
为 3 个 左右 ; OLAP 环境 ， 每 个 表 上 的 索引 为 5 个 左右 。 


6. 误区 六 : 索引 不 需要 DBA 过 多 维护 


很 多 DBA ÙN, X SQL 语句 创建 好 索引 不 万 事 大 吉 了 ， 这 是 错误 的 观点 。 实 际 上 ， 索 引 
和 表 一 样 ， 也 需要 一 些 手工 维护 工作 。 如 下 所 示 ， 当 首次 为 表 WEIGHTSOURCE 创建 索引 后 ， 
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需要 执行 runstats RE, JXXFÉDLM S8 Be PN EVE fei Is HP RATER SL ESI AERE : 


runstats on table DB2ADMIN.WEIGHTSOURCE with distribution on all columns and indexes all 


RIE AMRIK PRUETT EARE, BSI RIERREN, MA R 
SH UICE. FERRI VO 的 增加 ， 所 以 需要 定期 reorg 操作 。 如 下 所 示 ， 定 期 对 表 
WEIGHTSOURCE 执行 reorg 操作 : 


reorg indexes all for table DB2ADMIN.WEIGHTSOURCE 


> DH Sl > H 
4.6 fA zSiYL— E 
触发 器 Ctrigger) 是 定义 在 表 上 的 数据 库 对 象 ， 在 该 表 上 做 增删 改 操作 时 如 果 符 合 条 件 会 
触发 它 ， 并 执行 它 所 定义 的 逻辑 。 触 发 器 可 用 于 用 户 数据 检查 、 定 义 和 增 强 业 务 罗 辑 、 检 查 数 
据 完 整 性 、 记 录 审 计 信 息 和 生成 报警 等 。 
AT DB2 触发 器 的 开发 ， 请 参考 《从 Oracle 到 DB2 JF NIRE THOSE, Hifp 
了 如 何 使 用 SQL PL 语言 开发 触发 器 。 
关于 触发 器 的 使 用 场景 ， 不 同 的 人 有 不 同 的 看 法 。 我 认识 一 些 客 户 ， 他 们 告诉 我 说 ， 他 们 
禁 上 上 使 用 触发 器 。 是 啊 ， 触 发 器 让 数据 库 的 逻辑 变 得 混乱 ， 就 像 一 个 不 定时 的 炸弹 ， 谁 知道 它 
何 时 会 爆炸 呢 ? 因 此 ， 对 于 触发 器 的 设计 和 使 用 ,我 想 说 四 个 字 : “ 慎 用 , 少 用 ! ”但 所 谓 “ 存 
在 就 是 合理 ”， 触 发 器 在 某 些 场合 有 它 独 到 的 用 处 。 比 如 : 
e 触 友 器 可 以 在 不 改变 应 用 程序 的 情况 下 ， 实 现 某 些 新 的 业务 逻辑 。 
e 触发 器 可 用 来 记录 数据 更 改 的 历史 信息 ， 从 而 为 审计 所 用 。 
e 触 友 器 可 以 用 于 计算 生成 列 的 值 。 
触发 器 的 类 型 包括 : 
e BEFORE 触发 器 : 在 插入 、 更 新 或 者 删除 之 前 执行 触发 器 定义 的 动作 。 
e AFTER 触发 器 : 在 更 新 、 插 入 或 删除 操作 之 后 执行 的 动作 ， 用 于 更 新 反映 表 之 间 关 系 
或 一 致 性 的 其 他 表 中 的 数据 ， 以 确保 数据 完整 性 。 
e INSTEAD OF 触发 器 : 触发 器 定义 的 逻辑 会 代替 相应 的 操作 ， 比 如 对 不 支持 插入 、 更 新 和 
删除 操作 的 视图 执行 这 些 操作 ， 可 以 定义 INSTEAD OF 触发 器 转换 相应 的 增删 改 操 作 。 
下 面 我 们 举 一 个 AFTER 触发 句 的 例子 。 当 在 库存 表 (stock) 中 更 新 了 产品 数量 (qty) 后 ， 
如 果 剩 余 的 数量 小 于 等 于 $， 和 触发 需 在 另外 一 张 reorder 表 中 插入 一 条 记录 ， 提 醒 采 购 员 该 进货 
了 。 触 发 器 定义 为 FOR EACH ROW， 表 明 对 每 一 行 更 新 的 数据 ， 如 采 满 足 qtyc-5, 该 触发 占 
就 会 被 激活 一 次 。 
CREATE TRIGGER reorder 
AFTER UPDATE OF qty ON stock 


REFERENCING NEW AS n 
FOR EACH ROW MODE DB2SOQL 


when (n.qty <= 5) 
INSERT INTO reorder VALUES (n.itemno, current timestamp); 
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灵活 地 使 用 触发 右 可 以 方便 实现 东 些 业务 饮 辑 ， 从 而 避免 应 用 程序 编 但 。 但 是 使 用 触发 需 
要 尽量 谨 避 ,特别 在 高 并 发 的 表 上 尽量 避免 创建 过 多 的 触发 硕 ,， 因 为 触发 右 本 喘 有 如 下 局 限 性 : 

d) 表 上 如 果 有 过 多 的 触发 器 会 影响 性 能 。 这 很 好 理解 ， 因 为 进行 增删 改 操 作 时 ，DB2 
还 要 执行 相应 的 触发 费 操 作 , 触 帮 融 的 业务 多 辑 可 能 还 比较 复杂 ,这 对 增删 改 的 性 能 产生 影 啊 。 

(205 触发 锅 可 能 导致 表 的 天 系 变 得 复杂 : 如 果 表 上 定义 的 触发 袁 比 较 多 ， 或 是 触发 吉之 
间 的 关系 比较 复杂 ， 特 别 是 有 时 会 发 生 连 续 触 有 友 ， 这 在 设计 时 需要 特别 关注 。 

(3) 过 于 隐秘 : 由 于 租用 需 的 和 饮 辑 是 隐藏 在 数据 库 层 面 ， 出 现 问题 难以 肥 现 ， 难 以 调试 。 

在 设计 过 程 中 ， 需 要 对 触发 句 的 优 缺 点 进行 评 佑 ， 合 理 地 权衡 使 用 。 例 如 可 以 对 触发 器 与 
应 用 编程 实现 的 优 务 进行 比较 ， 如 果 确 实 需 要 采用 触发 占 ， 那 么 它 的 实现 远 辑 最 好 不 要 过 于 复 
淋 ， 耕 则 调试 起 来 很 困难 ， 也 会 对 性 能 造成 影响 。 
Aa 小 技巧 ， 可 以 使 用 DataStudio 调试 触发 中 

如 果 不 可 避免 地 需要 使 用 复杂 的 触发 器 ， 可 以 使 用 DataStudio 3.2 及 以 上 版 本 来 开 
发 ， 它 提供 了 强大 的 触发 器 开发 调试 功能 。 


4.7 小结 


逻辑 设计 在 数据 库 的 整个 生命 周期 中 至 关 重 要 ， 如 果 前 期 的 风 辑 设计 没有 做 好 ， 一 旦 系统 
上 线 ， 后 面 调整 的 代价 往往 非常 蜗 。 本 革 从 迪 辑 设计 的 基本 功 说 起 ， 肯 先 讲 到 了 风 辑 设计 不 仅 
要 深刻 理解 业务 需求 ， 还 应 该 一 开始 就 考虑 性 能 需求 。 然 后 介绍 了 如 何 做 好 基本 表 的 设计 ， 包 
括 规 范 化 、 柑 式 、 类 型 、 键 、 序 列 等 各 种 数据 对 象 ; 对 存储 过 程 开 发 中 常用 到 的 临时 表 ， 也 在 
43 市 作 了 介绍 ,分 别 讲解 了 DGTT 和 CGTT 的 使 用 和 它们 之 间 的 区 别 ; 对 于 时 态 数据 的 管理 ， 
DB2 V10 提供 了 新 的 特性 ，4.4 市 通过 各 种 实例 深入 讲述 了 系统 时 态 表 和 应 用 时 态 表 的 设计 和 和 
管理 。 在 4.5 市 深入 探讨 了 索引 的 内 部 结构 ， 并 通过 实际 调 优 有 东 例 分 析 了 索引 设计 的 各 种 误区 
和 相应 的 最 佳 实践 。 

掌握 基本 表 和 索引 的 设计 是 逻辑 设计 的 基本 功 。 利 用 这 些 搁 术 ， 可 以 为 设计 出 一 个 融 性 能 
的 数据 库 系统 打下 坚实 的 基础 。 


— — 
—o 
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高 级 逻辑 设计 


室 无 疑问 ， 数 据 库 的 数据 量 早已 到 入 TB 级 的 时 代 。 我 们 在 谈论 数据 量 的 时 候 ， 开始 以 TB 
为 单位 ， 例 如 菏 电 信 公 司 的 业务 系统 每 年 产生 的 数据 量 是 20TB， 这 给 数据 库 设计 市 来 很 大 的 
挑战 6 如 果 只 是 依靠 第 4 章 提 到 的 表 和 索引 的 基础 设计 技术 就 很 难 满足 这 种 条 件 下 的 性 能 需求 ， 
必须 使 用 更 高 级 的 设计 技术 才能 解决 问题 。 

本 章 将 给 大 家 讲解 DB2 的 高 级 设计 技术 ， 包 括 DPF ( 数据 库 分 区 功能 ) 、 表 分 区 、MDC 
( 多 维 集群 ) 、MQT ( 物化 查询 表 ) 和 压缩 技术 等 ， 这 些 高 级 技术 的 运用 是 一 门 追求 综合 平衡 、 
充满 辩证 的 哲学 ， 也 是 经 验 和 扩 术 不 断 积 标的 乞 术 。 只 有 充分 了 解 DB2 这 些 高 级 技术 以 及 适用 
场景 ， 玫 能 设计 出 满足 TB 级 数据 管理 需求 的 高 质量 解决 方案 。 
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5.1 如何 处 理 TB 级 的 数据 


好 的 数据 库 设 计 和 混乱 的 设计 有 天 壤 之 别 。 在 文 持 客户 的 经 历 中 ， 我 们 过 到 过 各 种 各 样 的 
系统 性 能 问题 ， 大 多 数 束 古 因为 设计 不 当 引 起 的 。 设 计 民 好 的 系统 ， 处 理 几 十 个 TB 的 数据 ， 
仍然 处 之 泰然 ， 不 层 不 忙 ， 仿 佛 强 藏 看 无 穷 的 能 量 ; 设计 不 好 的 系统 ， 即 使 物理 设备 配置 相当 
好 ， 处 理 几 十 个 GB 的 数据 ， 却 像 蜗 牛 一 样 ， 怎 么 也 跑 不 快 ， 把 人 痢 忽 死 了 。 


5.1.1 万 法 字 指 导 

我 们 需要 按照 第 1 章 讲 到 的 自 上 而 下 方法 学 指导 逻辑 设计 实践 。 在 开始 设计 新 系统 时 ， 就 
应 该 充分 了 解 需求 ， 站 在 性 能 优化 的 角度 ， 掌 握 DB2 提供 的 各 种 处 理 TB 级 数据 的 新 技术 ， 灵 
活 运用 各 种 技术 的 最 佳 实践 ， 避 免 误 区 和 地 雷 ， 

一 名 话 ， 处 理 海量 数据 时 ， 必 须 为 性 能 而 设计 ， 必 须 站 得 高 ， 看 得 远 。 

5.1.2 合理 运用 高 级 设计 技术 

我 们 遇 到 过 很 多 存在 性 能 问题 的 数据 库 系统 , 都 是 由 于 没有 合理 运用 DB2 提供 的 高 级 技术 


导致 的 。 所 以 ， 除 了 方法 学 指导 外 ， 还 要 合理 运用 DB2 提供 的 高 级 设计 技术 ， 主 要 包括 分 区 特 
性 、MQT 和 深度 压缩 技术 。 下 面 先 傈 单 介绍 一 下 ， 后 续 会 有 更 深入 的 探讨 。 


Aa 注意 : 别 被 名 字 搞 时 了 
数据 库 分 区 : 英文 全 称 为 Database Partitioning Facility， 简 写 为 DPF。 
表 分 区 : 英文 全 称 为 Table Partition. Range Partition 或 者 Data Partition. 
ARE: 英文 全 称 为 Multidimensional Clustering, (8) 5 7j MDC. 
物化 查询 表 : 英文 全 称 为 Materialized Query Table, (8) 5 7j MQT. 


1. 分 区 特性 


分 区 技术 在 原理 上 并 不 难 ， 束 是 分 而 治之 ， 也 就 是 将 一 张大 表 按 照 一 定 规则 划分 为 物理 上 
的 许多 小 表 ， 而 逻辑 上 仍然 维持 为 一 张大 表 。 这 样 ， 分 区 对 应 用 来 说 是 透明 的 ， 即 对 应 用 无 须 
做 任何 修改 ， 就 可 从 原来 访问 普通 表 改 为 访问 分 区 表 。 

如 表 5-1 所 示 ，DB2 提供 了 DPF、 表 分 区 和 MDC 三 种 分 区 技术 ， 它 们 可 以 单独 使 用 ， 也 
可 以 组 合 使 用 。 


表 5-1 DPF、 表 分 区 和 MDC 的 比较 
分 区 种 类 MDC 


PF 表 分 区 
建 表 子 名 “| DISTRIBUTE BY HASH PARTITION BYRANGE | ORGANIZE BY DIMENSION 


将 数据 按照 哈 希 算法 分 布 到 | 将 同一 范围 内 的 数据 放 在 


将 具有 相同 维度 值 的 记录 放 


原理 多 个 数据 库 分 区 上 ， 以 文 持 | 独立 的 数据 分 区 中 ， 文 持 
在 相同 的 物理 块 上 


大 规模 数据 的 并 行 处 理 快速 地 转 入 转 出 数据 


第 5 章 ddü6du 


CRE) 
分 区 种 类 MDC 
基于 数据 转 入 转 出 的 特点 
选择 合适 的 分 布 键 ， 将 记录 | o 二 人 区 A 
PL t , 3 
局 计 要 上 。 | 均匀 地 分 布 在 和 数据库 分 区 | ws 让 不同 的 去 | 迁 树 合适 的 维度 列 , 吾 则 会 带 
公示 A IAU 32 71s EA H 
cum 上 ， 并 提高 连接 中 的 表 并 置 i 来 大 量 的 存储 空间 浪费 


空间 或 者 存储 中 ， 尺 量 创 
建 分 区 索引 提升 性 能 


(Table Collocation ) 


FNETUEPUCETETIT | 

E DPF 多 分 区 环境 中 ,就 针对 一 个 特定 查询 ,需要 频繁 访问 多 个 表 并 进行 连接 操作 ， 

如 果 这 些 表 中 相关 数据 位 于 同一 个 分 区 中 ， 那 么 连接 成 本 就 低 ， 否 则 需要 使 用 不 同 的 策 
略 在 分 区 间 复 制 数 据 。 实 现 这 种 连接 中 的 表 处 理 方法 ， 就 是 表 并 置 。 


2. MQT 


MQT EAA WARA EXPER. KARRA, JH] MQT AW 
EG, APM pe BEREH MQT 中 的 数据 ， 而 不 是 使 用 基本 表 的 数据 进行 重新 计算 ， 从 而 显著 
提升 复杂 碍 询 的 性 能 。 报 表 、 多 维 分 析 等 应 用 可 以 通过 MQT 来 提升 性 能 。 

3. RIS Hk Zl 


在 关系 数据 库 中 ，LIO 往往 是 数据 库 中 开销 最 大 的 操作 。 对 数据 局 用 压缩 ， 读 取 相 同 的 数 
据 只 需 更 少 的 IO 次 数 ， 而 且 缓 剖 池 中 能 容纳 更 多 的 数据 ， 从 而 提高 缓冲 池 的 命中 率 ; 对 日 志 
局 用 压缩 ， 那 么 可 以 减少 日 志 的 存储 空间 和 日 忘 归档 所 花费 的 时 间 ; 08] 84378 HI HA TELA 
少 备份 的 存储 空间 ， 从 而 减少 备份 和 恢复 所 需要 的 时 间 。 


人 注意 : 多 留意 DB2 压缩 技术 的 演进 
DB2 提供 了 强大 的 数据 压缩 能 力 ， 不 仅 能 对 基本 表 的 数据 进行 压缩 ， 还 能 对 索引 、 
临时 表 、XML 数据 等 进行 压缩 ， 而 且 对 各 种 类 型 的 数据 都 有 很 好 的 压缩 比 。 

从 技术 演进 来 看 ，IBM 在 DB2 压缩 技术 上 一 直 保 持 持 续 的 改进 : 

DB2 V9.1 引入 了 表 级 行 压缩 技术 ; 

DB2 V9.5 中 加 入 了 自动 字典 创建 ( ADC ) 特性 ; 

DB2 V9.7 提供 了 对 XML 数据 和 临时 表 的 压缩 支持 ; 

DB2 V10.1 引入 自 适 应 (C Adaptive) 压缩 技术 ， 可 以 根据 数据 样本 的 不 同 吴 活 选 择 
4T Hk a Fa R JE H 


5.2 DB2 DPF ixit 


DB2 DPF W 75$ 4H dE 0t m EEP, ERB 10 章 将 会 深入 讲解 数据 仓库 中 的 DPF 特性 ， 
本 小 节 仅 介 绍 DPF 环境 下 的 表 设 计 。 
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那么 DPF 采用 什么 样 的 架构 呢 ?DPF 采用 非 共 享 (Share-Nothing) 体系 结构 ,包含 多 个 独 
也 的 分 区 《也 称 为 和 点) ， 每 个 分 区 都 具有 目 己 的 资源 ， 例 如 内 存 、CPU 和 磁盘 以 及 目 己 的 
数据 、 索 引 和 事务 日 志 。 在 DPF 环境 中 ，DB2 通过 哈 希 函数 计算 分 布 键 的 散 列 值 ， 随 后 根据 散 
列 值 将 表 中 数据 分 布 到 各 个 数据 库 分 区 中 。 因 此 ， 有 时 DPF 也 被 称 为 Hash 分 区 。 


5.2.1 DB2 DPF 技术 内 幕 


DPF 的 分 区 可 以 分 布 在 不 同 的 物理 机 器 上 ， 同 一 台 机 器 也 可 以 划分 多 个 逻辑 分 区 ， 这 种 设 
计 可 以 发 挥 MPP 服务 器 的 并 行 处 理 能 力 〈 关 于 什么 是 MPP， 什 么 是 SMP， 请 参考 第 10 章 ) 。 


例如 ， 在 数据 仓库 应 用 中 ， 数 据 规 模 能 达到 数 百 个 TB， 将 分 区 部 署 到 多 台 集 群 服务 器 上 是 一 
种 很 好 的 解决 方案 ， 这 样 复杂 查询 将 受益 于 DPF 的 并 行 处 理 特性 。 
DB2 DPF 是 基于 并 行 性 的 体系 架构 ， 如 图 5-1 所 示 。 


Partition 0 Partition 1 Partition 2 
coord 


agem+ 
«— db agents 


buffer 


ODÒ |- we 


«— extents 


4— 
«4—— 


1t + + 
O O 0 
parallel 9 9 9 
prefetch S 95 S 
"| 3 m] 
(D c (D 
T T T 
图 5-1 DPF 的 并 行 架构 


DPF 对 应 用 来 说 是 透明 的 。 就 如 同 向 单 分 区 DB2 发 出 SQL 请 求 一 样 ， 应 用 向 DPF 数据 库 
发 出 请 求 ， 这 时 协调 者 节点 (Coordinate Node， 被 连接 的 节点 ) 接收 到 请 求 后 ， 会 将 用 户 的 请 
求 分 解 成 多 个 子 任务 交 由 不 同 节 点 并 行 处 理 ， 每 个 节点 只 负责 处 理 目 己 的 数据 ， 最 后 协调 者 市 
点 将 各 节点 的 执行 结果 经 过 汇总 返回 给 应 用 。 

那么 如 何 定义 表 呢 ? Æ CREATE TABLE 语句 中 使 用 DISTRIBUTE BY 子 句 定义 分 布 键 。 如 
下 所 示 ，SALES 表 使 用 S ID 字段 作为 分 布 键 ， 其 中 TS_PD_N9 为 分 布 在 9 个 市 点 上 的 表 空 间 。 


CREATE TABLE SALES( 
S ID BIGINT NOT NULL, 
S SOLD DATE DATE NOT NULL, 
S PRODUCT SK INTEGER NOT NULL , 
S CUSTOMER SK INTEGER, 
S REGION CHAR(5), 
S QUANTITY INTEGER) 
DISTRIBUTE BY HASH(S ID) 
IN TS PD N9; 


$53 dud 229m 


DB2 将 根据 分 布 键 的 值 将 每 行 数据 分 布 到 各 个 节点 上 。 其 体 过 程 如 图 5-2 所 示 ，DB2 根据 
分 布 键 的 值 ， 利 用 Hash 函数 计算 出 一 个 介 于 0~32767 的 值 ， 然 后 在 Hash 映射 表 中 找到 该 行 数 
据 对 应 的 分 区 。 


Partitianing column(s) 


Other non-partitioning data columns 


Row to be inserted | 
[m 1 
Hashing 
function 
Currently DB2 uses a 4096 
beeh omen oot entry hash map for every table. 
NETWORK 
Data Data Data Data Data Data Data Data Data 
Partition | | Partition | | Partition | Partition | | Partition || Partition || Partition | | Partition || Partition 


图 5-2 ”DPF 根据 分 布 键 分 布 数据 


5.2.2 DB2 DPF 设计 最 佳 实践 


(o 注意 :DPF 设计 的 两 大 目标 E 
第 一 ， 所 有 记录 都 能 均匀 的 分 布 到 各 个 分 区 上 ; 
第 二 ， 选 择 合适 的 分 布 键 实现 表 并 置 ， 将 连接 操作 时 分 区 之 间 的 数据 传输 减少 到 最 小 。 


上 自 完 ， 将 大 表 帮 置 在 尽量 多 的 分 区 上 ， 将 小 表 放 置 在 尽量 少 的 分 区 上 上。 这样， 大 表 古 分 区 
的 ， 可 以 发 挥 并 行 处 理 的 优势 。 如 果 大 表 需 要 和 小 表 进 行 连接 ， 那 么 小 表 也 很 容易 被 复制 到 多 
个 分 区 上 ， 不 会 占用 过 多 网 络 珊 宽 。 


£s 小 技巧 ，DPF 设计 中 小 表 的 处 理 
小 表 一 般 放 置 在 单一 的 分 区 上 ,然后 使 用 复制 MQT 技术 将 该 表 复 制 到 多 个 分 区 上 ， 
从 而 实现 连接 并 置 。 例 如 ， 产 品 表 product 是 个 大 表 ， 放 置 在 9 个 分 区 上 ， 表 空间 为 
TS PD N9， 而 类 别 表 category 是 个 小 表 ， 放 置 在 单一 分 区 上 。 这 时 ， 可 以 使 用 下 面 的 
复制 MQT 语句 将 category 表 复 制 到 9 个 分 区 上 ,从 而 实现 product KF category 表 的 并 

置 连 接 。 


CREATE TABLE m category AS ( 
SELECT 5 BROÓM category 
) 
DATA INITIALLY DEFERRED 
REFRESH IMMEDIATE 
IN TS PD N9 
REPLICATED; 

REPRESI TABLE mM ES BCYO Oe vID 


其 次 ， 在 DPF 设计 中 ， 分 布 键 的 选择 是 重 中 之 重 ， 下 面 是 选择 分 布 键 的 一 些 最 佳 实践 : 
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CIO 选择 基数 〈Cardinality) 高 的 字段 作为 散 列 键 。 在 这 个 原则 下 ， 主 键 和 唯一 键 都 是 极 
好 的 选择 。 如 果 选 择 数据 分 布 不 均匀 的 衬 段 或 者 基数 低 的 字段 作为 散 列 键 ， 则 可 能 导致 数据 倾 


冬 ， 也 束 是 条 些 市 皮 上 数据 多 ， 而 人 条 些 节 后 数据 少 ， 在 处 理 人 查询 时 ， 可 能 需要 等 行 数 据 最 多 的 
Bo A BEER DU S M ASI SER IK e 


(o 注意 : 什么 是 基数 CCardinality) E 

基数 是 DB2 中 非常 重要 的 一 个 概念 ， 特别 是 在 分 区 设计 和 优化 器 中 ,基数 是 必须 理 
解 的 一 个 概念， 

表 的 基数 : 即 表 的 行 数 。 

列 的 基数 : 列 上 不 同 值 的 数目 。 例如， 一 共有 10000 种 产品 ， 那 么 订单 表 中 列 
PROD SK 的 基数 最 多 为 10000， 即 使 订单 表 有 1 亿 人 条 数据 。 在 设计 阶段 ， 应 该 根据 业务 
领域 的 知识 或 者 样本 数据 来 估计 列 的 基数 ， 如 公司 共有 20 个 部 门 , 一 年 最 多 366 K, 一 
年 12 个 月 ， 从 而 估计 相应 字段 的 基数 。 


(20 选择 类 型 简单 的 字段 ， 例 如 整 型 和 定 长 字符 类 型 ， 这 能 提高 Hash 算法 的 性 能 。 
(3) 避免 选择 更 新 频 索 的 学 段 作 为 分 布 键 。 

(4) 选择 查询 中 常用 连接 学 段 的 子 集 作 为 分 布 键 ， 以 满足 连接 并 置 。 

(5) 将 经 常用 于 GROUP BY 子 句 的 字段 包含 在 分 布 键 中 。 

C60 将 经 常 做 连接 的 表 放 在 同一 数据 库 分 区 组 中 。 

CI) 使 用 经 党 要 连接 的 字段 作为 分 布 键 ， 以 增加 并 置 连接 的 数量 。 


ns 
5.93. 34) bx VT 

表 分 区 ， 也 称 为 范围 分 区 ， 或 者 叫 数据 分 区 ， 它 是 根据 分 区 键 的 范围 ， 将 数据 放 在 不 同 的 
分 区 中 。 每 个 分 区 包含 该 表 的 一 部 分 记录 ， 并 且 与 其 他 记录 分 开 存 储 。 对 于 应 用 程序 来 说 ， 表 
分 区 技术 是 透明 的 ， 应 用 看 到 的 只 是 一 张 表 。 

表 分 区 的 每 个 分 区 都 可 以 存放 
在 相同 或 不 同 的 表 空 间 上 ， 存 放 在 不 Tablespace, 1 Re 
同 的 表 空 间 上 可 以 提升 IO 吞吐 量 。 | 
图 5-3 展示 了 普通 表 和 表 分 区 在 表 衬 
则 的 布局 : Regular Tl 为 普通 表 ， 只 
可 以 存放 于 一 个 表 空 间 Tablespace 2 
中 ; 表 RP T1 有 三 个 分 区 ,都 存储 在 
同样 的 表 空 间 Tablespace 1 中 ; x 
RP T2 有 两 个 分 区 ， 其 中 PO 存储 在 


Tablespace 1,P1 存储 在 Tablespace 3 
H, RP T3 有 4 个 分 区 ， 其 中 PO 存 图 5-3 表 分 区 和 普通 表 的 表 空 间 布局 


WE Tablespace 1 P, P1, P2 和 P3 
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存放 在 Tablespace 3 中 。 


5.3.1 表 分 区 技术 内 幕 


在 很 多 项 目的 分 区 方案 中 ， 在 指导 思想 上 往往 仅 考 虑 部 分 目标 ， 特 别 是 性 能 需求 ， 而 对 如 
何 运 用 分 区 技术 在 批量 数据 处 理 方面 考虑 甚 少 。 最 佳 分 区 设计 方案 应 该 是 对 性 能 需求 和 批量 数 


据 处 理 需 求 的 全 和 面 考 虑 和 综合 平衡 : 
e 性 能 需求 : 如 条 没有 分 区 ， 则 会 访问 整个 大 表 而 不 是 相关 分 区 ， 这 样 性 能 会 受到 影 啊 。 
如 果 SQL 语句 在 分 区 键 上 有 谓词 ,DB2 能 利用 分 区 的 范围 定义 排除 不 需要 访问 的 分 区 ， 
再 结合 分 区 索引 ， 从 而 大 大 提高 租 询 性 能 。 
e 批量 数据 处 理 需 求 : 在 很 多 系统 中 ， 经 单 存 在 大 批量 数据 迁移 、 数 据 转 入 转 出 等 需求 ， 
通过 分 区 技术 与 表 衬 间 设 计 相 结合 ， 可 以 在 分 区 级 完成 上 述 工 作 ， 将 大 大 提升 批量 数 
据 的 迁移 性 能 。 
先 看 如 何 创建 表 分 区 ， 根 据 CREATE TABLE 语句 中 PARTITION BY RANGE 子 句 的 分 区 
苑 围 ， 将 表 的 数据 划分 到 多 个 数据 分 区 中 。 如 下 例 所 示 ， 按 月 份 对 销售 表 〈SALES) 进行 范围 
分 区 ， 每 个 月 份 的 数据 放 在 一 个 独立 的 分 区 中 。 


CREATE TABLE SALES( 
S ID BIGINT NOT NULL, 

S9 SOLD DATE DATE NOT NULL; 

DECEIROIDUG TAS EN 

9 CUSTOMER SK INTEGER; 

S9 QUANTITY INTEGER; 
S5 SALES PRICE DECIMAL(7;2)) 

PARTITION BY RANGE (S_SOLD_DATE) 

(PART Jan2012 STARTING "2012=01=01" ENDING "2012=01=51" IN T61, 
PART Fe92012 STARTING "2012=-02=01" ENDING "2012=-02=29%9" IN T62, 
PART Mar2012 STARTING "2012=03=01" ENDING “2012=03=31" IN TS3,; 
PART Apr2012 STARTING "2012-04-01" ENDING “2012=04=30" IN Sue 
PART May2012 STARTING “"2012-=-05=01" ENDING "2012=05=31'" IN T65, 
PART Jun2012 STARTING "2012=-06=01" ENDING "2012=06=30" IN TS6, 
PART Jul2012 STARTING "2012=-07=01" ENDING “2012=07=351" IN T67, 
PART Aug2012 STARTING "2012-08-01" ENDING "2012-=08=31'" IN TSS, 
PART 6ep2012 STARTING "2012=-09=01" ENDING "2012-09-30" IN TSO, 
PART OtE2012 STARTING "2012=10=01" ENDING "2012=10=51" IN T$10, 
PART NOoy2012 STARTING "2012=11=01" ENDING "2012=11=50" IN T$11, 
PART Dec2012 STARTING "2012=12=01" ENDING "2012=12=51" IN TS12)3 


X Sales 的 分 区 结构 如 图 5-4 所 示 ， 对 于 应 用 程序 来 说 ， 它 们 看 到 的 只 是 一 张 表 ， 如 果 所 
插入 的 数据 行 不 满足 任何 一 个 分 区 范围 的 条 件 时 ， 则 会 出 现 如 下 错误 “SQL0327N : The row 


cannot be inserted because it is outside the bounds" 。 


Sales 表 


图 5-4 Sales 表 的 数据 分 区 


创建 分 区 表 后 ,可 以 使 用 DESCRIBE DATA PARTITIONS 命令 查看 各 分 区 的 定义 ， 具 体 语 
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法 为 : 


DESCRIBE DATA PARTITIONS FOR TABLE <rp table name» [SHOW DETAIL] 


查看 上 例 中 表 SALES 的 分 区 信息 如 下 所 示 ， 分 区 的 ID、 范围 定义 、 分 区 名 字 和 分 区 的 表 
空间 ID 一 日 了 然 : 


DESCRIBE DATA PARTITIONS FOR TABLE sales SHOW DETAIL; 


BartitionId Inelusive (y/n) Inclusive (y/n) 
Low Value High Value 
0 x "“2012=01=01" ¥Y “2012=01=31" 
lY “2012-02-01 Y “2012=02=29" 
2 Y "2012-03-01" YY "2012-=03-=31! 
3 x 12012=04=01" Yy “2012=04=30" 
4 X "2012=05=01" Yy “2012=05=31" 
5 ¥ 2012-=06-=01° ïy “2012=06=30" 
6 Y 12012=07=01" uz “2012=07=31" 
7 Y 2012-=08-01! Y “2012=08=31: 
S. YY "2012=09=01" x “2012=09=30 " 
9 Y 12012=10=01" ap “2012=10=31" 
Voy YZOL2-ILI- 0L Y "2012=11=30" 
ll. Y “2012=12=-01" Y '2012-12-31' 


12 record(s) selected. 


PartitionId PartitionName TableSpId PartOobj Tc IndexTblSpId 
LongTblSpId AccessMode 
STATUS 
0 JAN2012 7 25 7 T E 
1 FEB2012 8 4 8 3 F 
2 MAR2012 20 4 20 20 F 
3 ABR2012 21 4 21 21 E 
4 MAY2012 22 4 22 22 F 
5 JUN2012 2.5 4 23 23 F 
6 JUL2012 24 4 24 24 E 
7] AUG2012 2 4 25 25 F 
8 SEB2012 2/6 4 26 26 FE 
9 OTC2012 2 4 2 21 E 
A516 EO HEADS. 28 4 28 20 F 
11 DEC2012 29 4 29 29 F 


12 record(s) selected. 


YN 注意 : 分 区 表 空 间 设计 非常 重要 
分 区 设计 中 ， 可 以 指定 每 个 分 区 存放 于 哪个 表 空 间 ， 即 可 以 在 分 区 级 进行 表 空 间 设 
计 。 但 是 ， 很 多 项 目 在 分 区 表 空 间 设 计 上 很 随意 ， 把 所 有 分 区 都 放 到 同一 个 表 空 间 中 。 
这 导致 DBA 无 法 在 表 空 间 级 进行 与 业务 有 关 的 数据 管理 工作 ， 倒 如 无 法 进行 表 空 间 级 
的 数据 迁移 ， 无 法 进行 表 空 间 级 的 数据 备份 恢复 。 
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上 面 创 建 表 分 区 的 例子 似乎 稍 显 复杂 ， 它 指定 了 分 区 名 、 各 分 区 范围 的 起 始 值 和 绪 束 值 。 
事实 上 ，DB2 提供 了 各 种 简洁 的 语法 形式 ,方便 用 户 使 用 。 恋 者 可 以 学 习 一 下 下 面 的 几 个 例子 。 
例 1: 创建 表 分 区 时 可 以 不 指定 ENDING 子 句 ， 而 由 STARTING 定义 分 区 范围 。 


CREATE TABLE SALES (S SOLD DATE DATE NOT NULLO; © CUSTOMER SK INTEGER; oo o) 
PARTITION BY RANGE (S_SOLD_DATE) 

CARES TAR TEN GE O ON On 

PART P2 STARTING '2012-04-01', 

PIEWqUDSSSTARTPINGS 20087. 7 IM 

PART PA STARTING '2012-10-01' ENDING MAXVALUE 

) 


例 2: 创建 表 分 区 时 用 ENDING 子 句 指定 分 区 范围 ， 分 区 名 由 系统 生成 。 


CREATE TABLE SALES(S SOLD DATE DATE NOT NULL; $ CUSTOMER NS 
PARTITION BY RANGE (S_SOLD_DATE) 

(STARTING "2012-=01-=01 ENDING “2012=03=31", 

ENDING '2012-06-30', 

ENDING '2012-09-30', 

ENDING MAXVALUE 

) 


例 3: 使 用 EVERY 短语 法 创建 表 分 区 。 


CREATE TABLE SALES(S SOLD DATE DATE NOT NULLO; © CUSTOMER SK INTEGER} oo o) 
PARTITION BY RANGE (S_SOLD_DATE) 
(STARTING '2012-01-01' ENDING '2012-12-31' EVERY 3 MONTHS) 


例 4: 指定 多 个 字段 作为 分 区 键 。 


CREATE TABLE SALES (year INT, month INT; soo) 
PARTITION BY RANGE(year, month) 

(simae EStG O IY emp JEN: e 2UT 2-- 
STARTING (2012, 4) ENDING (2012, 6), 
STARTING (2012, H) ENDINGS 2012, V), 
STARTING (2012, 10) ENDING (2012, 12)) 


人 小 技巧 ， 如 何 找 到 分 区 表 的 分 区 名 
由 于 在 管理 和 维护 表 分 区 时 ， 需 要 知道 分 区 的 名 字 ， 对 于 省 略 的 分 区 名 字 或 分 区 范围 ， 可 
以 用 DESCRIBE DATA PARTITIONS 命令 或 者 查询 系统 编目 表 SYSCAT. DATAPARTITIONS 
得 到 。 


人 注意 : 分 区 字段 的 数据 类 型 
分 区 字段 的 数据 类 型 必须 是 数值 .字符 或 日 期 等 基本 类 型 ,不 能 使 用 LOBS fe LONG 
VARCHARS。 定 义 分 区 范围 时 有 两 个 特殊 值 MINVALUE 和 MAXVALUE， 它 们 分 别 用 
来 指定 最 小 值 和 最 大 值 ， 


最 后 ， 总 结 一 下 表 分 区 的 主要 优势 : Hu. 数据 可 以 按 范围 分 区 并 存放 在 不 同 的 表 空 间 中 ， 
这 样 可 以 方便 数据 的 转 入 转 出 ; 其 次 , 提高 了 SQL 处 理 的 性 能 , 由 于 各 个 月 份 的 数据 分 区 存放 ， 
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如 末 用 户 需 要 访问 茶 一 特定 月 份 的 数据 ， 可 以 直接 对 相应 的 分 区 访问 即 可 ， 这 样 避 免 了 访问 不 
感 兴趣 的 数据 ， 再 次 ， 将 数据 放 在 不 同 的 表 空 间 ， 在 进行 数据 访问 时 ， 可 以 进行 并 行 WO， 以 
提高 访问 效率 最后， 使 用 表 分 区 还 有 锁 方 面 的 好 处 是 ， 当 应 用 程序 访问 茶 一 月 份 数据 时 ， 只 
需 对 相应 的 分 区 加 锁 ， 从 而 避免 了 像 普通 表 一 样 对 整个 表 加 锁 ， 这 陨 提 高 了 并 发 性 。 


5.3.2 全 局 索引 vs 分 区 索引 


很 多 设计 开发 人 员 经 常 感到 困惑 : 己 经 用 上 了 分 区 表 了 ， 为 什么 性 能 还 是 没有 提高 啊 ? 其 
至 有 的 更 慢 ! 原因 很 可 能 是 没有 合理 设计 分 区 索引 ， 更 深层 次 是 没有 搞 明 白 DB2 全 局 索引 和 分 
区 索引 的 原理 和 适用 场景 。 

在 DB2 V9.7 以 前 ， 表 分 区 只 支持 全 局 索引 (或 者 称 为 非 分 区 索引 ) ， 这 样 即使 数据 是 分 
布 在 多 个 表 空 间 上 的 ， 表 分 区 的 所 有 索引 也 只 能 存储 在 同一 个 表 空 间 中 。 这 约束 了 索引 扫描 的 
并 行 性 ， 并 对 管理 分 区 的 转 入 转 出 带 来 不 利 影响 。 

DB2 V9.7 开始 使 用 分 区 索引 (局 部 索引 ) 的 组 织 方案 ， 分 区 索引 根据 表 的 分 区 方案 分 散 存 
储 ， 每 个 索引 分 区 都 只 引用 对 应 数据 分 区 中 的 表 行 。 

1. 全 局 索引 


全 局 索引 作为 整个 表 的 单一 对 象 来 存储 。 创 建 全 局 索引 时 ， 必 须 使 用 NOT PARTITIONED 
子 句 。 这 可 以 在 CREATE TABLE 语句 中 使 用 INDEX IN 子 句 来 指定 索引 的 默认 存储 表 空 间 ， 
也 可 以 在 CREATE INDEX 语句 中 使 用 IN FA 
特别 指定 该 索引 的 表 空 间 。 如 果 没 有 显示 指定 ， 
全 局 索引 默认 创建 在 第 一 个 数据 分 区 所 在 的 表 
Za]. 

如 图 5-5 所 示 ， 在 表 t1 上 创建 的 两 个 索引 
il 和 i2 是 全 局 索引 ,其 中 i 索引 数据 存放 在 表 
空间 tbsp4 中 ，i2 索引 数据 存放 在 表 空 间 tbsp5 
中 ， 它 们 都 会 索引 所 有 分 区 的 数据 。 

CREATE TABLE tl1(el INT, ©2 INT) 

IN tbspl, tbsp2, COSp 
INDEX IN tbsp4 


PARTITION BY RANGE (c1) 
(STARTING FROM (1) ENDING (100)EVERY (33)) 


图 5-5 全 局 索引 


CREATE INDEX il ON tl1(cl) NOT PARTITIONED 
CREATE INDEX i2 ON tl1(c2) NOT PARTITIONED IN tbsp5 


2. 分 区 索引 


对 于 分 区 索引 ， 每 个 表 分 区 都 有 目 己 的 索引 分 区 ， 在 V9.7 UE, CERTA uei zs s] T 
的 默认 闫 型。 每 个 索引 分 区 默认 存放 在 相应 数据 分 区 所 在 的 表 空 间 ， 并 可 在 CREATE TABLE 
语句 定义 各 分 区 时 用 INDEX IN 子 句 来 特别 指定 该 分 区 索引 的 表 空 间 。 
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G 注意 : 创建 分 区 索引 的 常见 误区 
很 多 设计 人 员 在 创建 分 区 索引 时 和 希望 和 全 局 索引 一 样 ,用 CREATE INDEX 的 IN F 


只 能 由 


多 指定 分 区 索引 的 表 空 间 ， 这 是 一 个 最 常见 误区 。 实 际 上 ， 分 区 索引 的 表 空 间 

CREATE TABLE 定义 各 分 区 时 的 INDEX IN 子 名 显示 指定 ， 否 则 默认 就 存放 在 数据 所 

在 的 表 空 间 。 

如 图 5-6 所 示 , 索引 il AR t1 的 分 区 索引 , 每 个 数据 分 区 的 索引 和 相应 的 数据 存放 在 一 起 ， 
位 于 同一 个 表 空 间 。 索 引 HRU 上 的 全 局 索引 ， 它 位 于 独立 的 表 空 间 tbsp4 中 。 建 表 和 建 索 


引 的 DDL 语句 如 下 所 示 : 


(OAR A (NN 
IN tospl, tosp2,;, tbsp 
INDEX IN tbsp4 
PARTITION BY RANGE (c1) 
(STARTING FROM (1) ENDING (100)EVERY (33)) 


PARTITIONED 
NON PARTITIONED 


CREATE INDEX il ON tl(cl) 
CREATE INDEX 12 ON T1 (e2) 


z^. E 5-6 还 列 出 了 表 t2 的 索引 分 布 情况 。 在 创建 表 t2 的 语 名 中， 用户 指定 了 分 区 1 
和 分 区 2 的 索引 存放 在 表 空 间 tbsp5 中 ， 分 区 3 的 分 区 索引 则 存放 在 和 相应 数据 捷 在 的 表 空 间 


tbsp3 F. £EXCRIS ZR SIT DDL 语句 如 下 所 示 : 


(BAER TA (te NN) 

IN tospli, tosp2, TOS 

INDEX IN tbsp3 

PARTITION BY RANGE (c1) 

(STARTING FROM (1) ENDING (33) INDEX IN tbsp5, 
STARTING FROM (34) ENDING (66) INDEX IN tbsp5, 
STARTING FROM (67) ENDING (100)) 

CREATE INDEX i3 ON t2(c1) PARTITIONED 


E56 分 区 索引 


3. 全 局 索引 vs 分 区 索引 
首先 ， 全 局 索引 有 目 己 的 独特 优势 。 如 果 一 个 得 询 需 要 读 取 多 个 分 区 的 数据 然后 进行 排序 
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或 者 聚集 ， 那 么 在 排序 字段 上 建立 全 局 索引 可 以 避免 额外 的 排序 。 例 如 ， 表 purchaseOrders 在 
po date 字段 上 按 月 进行 分 区 ， 如 果 字 段 po customer 上 的 索引 是 分 区 索引 ， 那 么 下 面 这 个 查询 
在 索引 扫 摘 后 将 需要 一 次 排序 。 

SELECT po id, po customer FROM purchaseOrders 


WHERE po date » '2/15/2010' AND po date « '4/15/2010' 
ORDER BY BO CUSEOMEE? 


解决 办 法 是 在 po customer 字段 上 建立 全 局 索引 ， 它 能 避免 索引 扫描 后 的 排序 。 

与 全 局 索引 相 比 ， 分 区 索引 的 优势 更 明显 : 第 一 ， 在 存储 管理 上 ， 分 区 索引 禹 来 了 更 多 精 
细 的 控制 ， 并 能 提供 索引 的 VO 并 发 访问 ;第 二 ， 绪 合 分 区 排除 技术 ， 处 理 得 询 时 上 只 需 访问 相 
应 数据 分 区 的 分 区 索引 ， 减少 了 LO 操作 ， 提 高 了 索引 扫 摘 的 性 能 ， 第 三 ， 分 区 索引 能 改善 数 
据 转 入 转 出 的 性 能 ， 减 少 了 这 个 过 程 中 索引 的 维护 开销 。 

所 以 ， 大 家 在 具体 设计 工作 中 ， 要 灵活 运用 ， 发 挥 不 同 索引 的 优势 。 


5.3.3” 转 入 转 出 


通过 表 分 区 拉 术 可 以 实现 数据 快速 的 转 入 转 出 ， 这 给 DBA 维护 大 数据 提供 了 极 大 的 便利 。 
例如 ， 要 删除 条 个 大 表 中 一 个 季度 的 数据 ， 如 果 使 用 delete 语句 删除 ， 那 将 需要 漫长 的 过 程 ， 
而 通过 表 分 区 的 转 入 转 出 可 以 让 这 个 操作 瞬间 完成 。 

1. 转 入 操作 


转 入 操作 将 一 个 现 有 表 转 换 成 分 区 表 中 的 一 个 狐 数 据 分 区 ， 操 作 命 令 为 Attach， 这 个 操作 
速度 极 快 ， 对 查询 该 表 的 应 用 程序 造成 的 影响 很 小 。 
下 面 我 们 用 例子 说 明 ， 表 NewMonthSales 包含 2013 年 1 月 份 的 销售 数据 ， 将 其 转 入 到 表 
SALES 中 ， 过 程 如 下 。 
第 一 步 ,利用 ALTER TABLE 语句 的 ATTACH 命令 ,将 表 NewMonthSales 加 入 到 表 SALES 
中 ,使 其 成 为 一 个 新 的 分 区 。 执 行 ATTACH 操作 时 需要 获取 表 SALES 上 的 Z 锁 ,不 过 , ATTACH 
操作 不 需要 数据 移动 ， 也 不 需要 维护 索引 ， 速 度 很 快 。 执 行 COMMIT 后 ， 原 来 的 数据 分 区 可 
以 被 访问 ， 但 是 新 分 区 仍然 不 可 见 。 
第 二 步 ， 使 用 SET INTEGRITY 命令 完成 剩余 工作 ， 包 括 验 证 数据 、 维 护 全 局 索引 和 局 部 
和 索引、 维护 相应 的 MQT 等 。 这 些 操作 DB2 会 在 后 台 执 行 ， 也 就 是 说 ， 当 它 运 行 时 ， 原 有 的 数 
据 仍 然 可 以 正常 使 用 。 这 一 步 结束 并 COMMIT 后 ， 转 入 操作 就 彻底 完成 了 ， 新 的 数据 分 区 就 
可 用 了 。 
-- 步 骤 1: 
ALPER TABLE SADES 
ATTACH PARTITION Jan2013 
STARTING "01/01/2013" ENDING “01/31/2013 


FROM TABLE NewMonthSales; 
COMMIT; 


--- 步 又 2: 
SET INTEGRITY FOR Sales IMMEDIATE CHECKED 
COMMIT; 
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下 面 是 转 入 数据 最 佳 实践 : 

d) 尽量 使 用 局 部 索引 代 蔡 全 局 索引 ， 从 而 加 速 数 据 的 转 入 。 

(2) 数据 转 入 前 ， 在 诛 表 上 创建 合适 的 索引 ， 使 得 与 表 分 区 的 局 部 索引 完全 匹配 。 同 时 ， 
在 转 入 时 ， 用 REQUIRE MATCHING INDEXES 子 句 强制 索引 匹配 。 

(3) 在 每 一 步 完成 后 及 时 COMMIT， 释 放 相 关 的 锁 。 

(4) 保证 原 表 上 的 数据 满足 各 种 约束 ， 例 如 ， 其 分 区 键 的 值 应 该 满足 分 区 定义 的 范围 ， 
从 而 减少 SET INTEGRITY 的 时 间 。 


2. 转 出 操作 


转 出 操作 的 命令 为 Detach, 它 提供 了 一 种 从 分 区 表 转 出 数据 的 极 快 方式 。 转 出 操作 将 现 有 的 
汇 围 分 区 分 离 成 单独 的 表 , 对 原 表 来 说 该 分 区 的 数据 立刻 变 得 不 可 见 , 这 对 奉 询 造成 最 小 的 干扰 。 
这 种 方式 适用 于 东 个 分 区 的 数据 当前 不 再 需要 ， 可 以 作为 历史 数据 进行 备份 处 理 或 者 删除 。 
分 区 转 出 操作 的 语句 示例 如 下 : 
ALTER TABLE SALES 
DETACH PARTITION Jan2012 


Into TABLE OldMonthSales 
COMMIT; 


转 出 操作 的 DETACH 命令 很 徐 单 ， 而 且 很 快 。 这 幕后 的 过 程 如 下 : 

第 一 步 ，DETACH 语句 将 表 SALES 中 分 区 Jan2012 分 离 出 去 ， 使 其 成 为 一 个 独立 的 新 表 
OldMonthSales 表 。 执 行 该 语句 时 ， 需 要 获取 表 SALES 上 的 Z 8. 不 过 不 需要 移动 数据 ， 也 不 
会 进行 索引 相关 的 数据 维护 ， 所 以 这 个 操作 极 快 。 

第 二 步 ， 使 用 COMMIT 语句 提交 后 ，SALES 表 上 的 Z 锁 被 释放 ，SALES 表 的 其 他 分 区 可 
以 正常 工作 ， 而 被 分 离 的 数据 分 区 Jan2012 变 成 不 可 见 。 在 这 个 过 程 中 ， 全 局 索引 和 分 区 索引 
并 没有 同步 清理 。 

第 三 步 ，DB2 启动 一 个 异步 索引 清除 (AIC) 线程 ， 它 在 后 台 以 较 低 优先 级 运行 ， 用 于 清 
理 和 维护 索引 。 与 此 同时 ， 可 以 对 分 离 的 独立 表 OldMonthSales 进行 备份 和 删除 等 操作 。 

最 后 ， 总 结 一 下 转 出 数据 最 佳 实践 : 

CD 在 转 出 分 区 数据 后 ， 及 时 COMMIT 以 释放 相关 锁 。 

(2) 可 用 LIST UTILITIES SHOW DETAIL 来 监控 异步 分 区 转 出 进程 。 

(3) 如 果 需 要 转 出 多 个 分 区 ， 用 LIST UTILITIES SHOW DETAIL 命令 监控 前 一 个 分 区 
DETACH 彻底 完成 后 《包括 索引 清理 和 维护 完成 ) ， 再 进行 下 一 个 分 区 的 DETACH 操作 ， 避 

表 分 区 的 转 入 转 出 操作 ， 最 大 的 好 处 束 是 快 ， 操 作 可 以 瞬间 完成 ， 对 应 用 影响 小 。 究 其 原 
央 ， 束 在 于 不 引发 数据 移动 ， 而 数据 和 索引 的 维护 在 后 台 异 步 进 行 ， 不 影响 原 有 的 数据 。 


5.3.4 分 区 排除 技术 


4] PXTEER CPartition Elimination) 就 是 DB2 优化 右 能 判断 菜 些 分 区 在 处 理 查 询 时 根本 不 需 
要 被 访问 ， 从 而 提高 查询 性 能 。 
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DB2 将 使 用 分 区 排除 技术 ， 
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如 图 5-7 所 示 , 现在 要 查询 代码 为 101920 的 产品 在 二 月 中 旬 到 三 月 中 旬 的 销售 总 量 , 这 时 ， 
判断 该 查询 只 需 访 问 分 区 Feb2012 和 Apr2012 两 个 分 区 。 


SELECT SUM(S_QUANTITY) FROM SALES 
WHERE S, SOLD. DATE between 2012-02-16 and '2012-03-15' 
and S PRODUCT SK = 101920 


Sales 


图 5-7 分 区 排除 


在 访问 计划 中 ， 可 以 看 到 该 得 询 分 区 排除 的 详细 信息 ， 如 下 所 未 : 


Original Statement: 

SELECT UM QUANTITY) FROM SALES 

WHERE S_SOLD DATE between '2012-02-16' 
and S PRODUCT SK 101920 


ane 2012-03-15. 


Optimized Statement: 
SELECT Q03.$C0 
FROM 
(SELECT SUM (02-6 QUANTITY) 
FROM 
(SELECT QLS QUANTITY 
EEOMOTPOIDSS SAIS 下 
WHERE (Q1.S PRODUCT SK 
("2012=02=16" «= 


AND 


= 101920) AND 20d » cuc 


QUIE ODD 


(UL c St ONE. joydurie, 
AS 02) R5 OS 


Access Plan: 
Total Cost: 3082 -42 
Query Degree: 1 


Rows 
RETURN 
(l) 
COST 

Jy 

| 

1 
GRPBY 
(2) 
3062,42 
2 lol. 76 

| 
292606.6 
PELCH 
C) 
3078,39 
2151,76 

/----+----- \ 
73166,5 T.3916 6066+t06 
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IXSCAN DP-IABIESOEPCIDDS 


( 4) SALES 
848.525 Q1 
721.12 


| 
7.316668106 
DP-INDEX: TPCDS 
S PROD IX 
Q1 


4) IXSCAN: (Index Scan) 


Cumulative Total Costs 595.25 
Cumulative CPU Cost: 1.29061395e6407 
Cumulative I/O ost YHP 
Cumulative Re-Total Cost: 3-590668 
Cumulative Re-CPU Cost: 6.53036e400 
Cumulative Re-I/O Cost: 0 

Cumulative First Row Cost: 15.1494 
Estimated Bufferpool Buffers: 1723.12 
Arguments s: 


CUR COMM; (Currently Committee) 
TRUE 

DPESTFLG: (Number of data partitions accessed are Estimated) 
FALSE 

DPLSTPRT: (List of data partitions accessed) 
1-2 

DPNUMPRT: (Number of data partitions accessed) 
2 

GLOBLOCK: (Global Lock intent) 
INTENT SHARE 

LCKAVOID: (Lock Avoidance) 


TRUE 

MAXPAGES: (Maximum pages for prefetch) 
7119 

PREFETCH: (Type of Prefetch) 
SEQUENTIAL 

ROWLOCK : (Row Lock intent) 
SHARE (CS/RS) 

SCANDIR enn 
FORWARD 

OKIE INS: (kip Inserted ROWS) 
TRUE 

TABLOCK : (Table Lock intent) 


INTENT SHARE 
TBISOLVL: (Table access Isolation Level) 
(CIUBSOPSSqABTENMSET]Y 


Predicates: 


2) Start Key Predicate, 
Comparison Operator: Equal ( 


) 
Subquery Input Required: No 
Pilreer rFactor: 0.04 


Predicate Text: 
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(Q1.S PRODUCT SK - 101920) 


2) Stop Key Predicate, 
Comparison Operator: Equal (=) 
Subquery Input Required: No 
Filter ractors 0.04 


Predicate Text: 


(Q1.SS CUSTOMER SK = 1) 


DP Elim Predicates: 


Range 1) 
Stop Predicate: (Q1.S SOLD DATE <= '2012-03-15") 
Start Predicate: ('2012-02-16' <= Q1.S SOLD DATE) 


从 上 和 面 访问 计划 中 可 以 看 到 ，TP-TABLE 表示 SALES 表 为 分 区 表 ， 有 2 个 分 区 被 访问 ， 
即 由 1-2 标识 的 这 两 个 分 区 ,用 来 做 分 区 排除 的 谓词 正 是 分 区 键 S SOLD DATE 上 的 查询 条 件 。 


5.3.5 分 区 维护 


首先 ， 分 区 键 的 选择 决定 了 数据 划分 的 方式 。 如 末 硕 望 实现 基于 时 间 的 转 入 转 出 ， 那 么 量 无 
疑问 ,使 用 时 间 ( 周 、 月 或 季 ) 来 进行 分 区 是 不 错 的 选择 。 如 末 硕 望 使 用 表 分 区 作为 一 个 性 能 解 
决 方 采 ， 将 表 中 的 数据 拆 分 存放 为 不 同 的 物理 对 象 〈( 从 而 存储 在 不 同 表 空间 或 磁盘 上 )〉 ， 那 么 
选择 国家 、 省 份 、 地 区 、 部 门 、 子 公司 、 产 品 分 类 等 ， 都 是 合理 的 选择 。 

其 次 ， 控 制 分 区 的 粒度 和 分 区 的 个 数 。 分 区 范围 大 小 与 通 帝 数据 转 入 转 出 的 大 小 一 致 羡 理 
想 的 选择 。 如 果 分 区 范围 太 小 ， 会 导致 分 区 数目 过 多 ， 这 将 市 来 管理 上 的 麻烦 和 空间 肖 避 。 

最 后 ， 尺 量 使 用 分 区 索引 ， 因 为 它 对 转 入 转 出 性 能 融 来 了 很 大 的 好 处 ， 而 且 结 合 分 区 排除 
技术 ， 在 处 理 碍 询 时 分 区 索引 比 全 局 索引 效率 更 融 。 

下 面 来 看 看 表 分 区 设计 调整 与 维护 的 几 个 典型 场景 : 

1. 将 普通 表 转 换 成 表 分 区 


如 何 将 一 个 普通 表 转 换 成 分 区 表 ? 是 否 可 以 直接 用 ALTER TABLE 实现 这 种 改变 ? 遗憾 的 
是 ， 这 种 转换 没有 捷径 可 走 ，ALTER TABLE # A ETE. 

这 里 提供 一 个 方案 ， 将 普通 表 转 换 成 分 区 表 : 

(1) 创建 一 个 分 区 表 ， 有 字段 定 义 和 普 通 表 完全 一 样 ， 根 据 数据 的 热度 将 数据 分 区 放 在 不 
同 的 表 空间 。 

(2) 将 普通 表 的 数据 用 export. db2move 或 者 ADMIN MOVE TABLE 存储 过 程 导出 。 

(3) 将 数据 用 LOAD 导入 到 新 建 的 表 分 区 中 。 

(4) 创建 合适 的 分 区 索引 。 

(5) 用 DROP 语句 删除 普通 表 。 

(60 用 RENAME 语句 将 分 区 表 重 命名 ， 名 宇和 普通 表 一 样 。 
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2. 增加 新 分 区 


如 打分 区 表 没 有 相应 的 分 区 定义 ， 那 么 这 时 束 需 要 增加 新 的 分 区 ， 如 下 所 不 为 SALES 表 
新 加 一 个 分 区 Jan2013. 
ALTER TABLE Sales ADD PARTITION Jan2013 
STARTING ("2015=01=01!") ENDING ("2012=01=31") 


IN Tosp Carta 2012M INDEX IN Tosp Iz 2012M1 5; 
COMMIT; 


比较 : 增加 新 分 区 vs 转 入 分 区 


增加 新 分 区 只 是 增加 空 的 分 区 定义 ， 用 于 扩展 分 区 以 满足 日 益 增 长 的 业务 需要 。 而 转 入 分 
区 则 将 现 有 的 表 转 换 成 表 分 区 的 一 个 新 数据 分 区 ， 在 增加 新 分 区 的 同时 也 包含 源 表 的 数据 。 


/小 技巧 :增加 新 分 区 技巧 | 
增加 新 分 区 时 ， 最 好 在 一 个 维护 窗口 一 次 性 增加 多 个 分 区 。 但 是 ， 也 要 避免 增加 太 
多 分 区 ， 因 为 这 样 会 影响 表 级 别 的 统计 信息 ， 从 而 影响 优化 器 选择 访问 计划 ， 


3. 删除 分 区 数据 


出 于 某 种 原因 需要 将 某 分 区 的 数据 删除 ， 但 是 需要 保留 分 区 的 定义 。 用 DELETE 直接 删除 
无 疑 太 慢 ， 而 且 会 记录 大 量 的 日 志 ， 而 TRUNCATE 命令 又 不 支持 清除 掉 某 分 区 的 数据 。 那 么 
怎么 办 呢 ? 第 一 步 ， 从 Sales 表 转 出 分 区 Jan2012 到 表 Jan2012Sales; 第 二 步 , 使 用 TRUNCATE 
命令 清空 Jan2012Sales K; 第 三 步 ， 重 新 从 空 表 Jan2012Sales P] Sales 表 转 入 新 分 区 ， 这 时 分 
区 Jan2012 CAW T 


=>9 IBP 1L? 

ALTER TABLE Sales DETACH PARTITION Jan2012 INTO Jan2012Sales; 
CONMATE 

IUBE 

TRUNCATE TABLE Jan2012Sales IMMEDIATE; 

ccc TBI 

ALTER TABLE Sales ATTACH PARTITION Jan2012 

STARTING ("2012=01=01") ENDING (2012=01=31") 

FROM TABLE Jan2012Sales REQUIRE MATCHING INDEXES 


5.3.6 V10 新 特性 : 多 温度 存储 


数据 有 冷暖 ， 根 据 访问 频率 可 以 分 为 “ 冷 Ccold) ” ~ “Æ (warm) ”和 “ 热 Cho ”。 
从 SATA 磁盘 ,到 SAS 可 ,再 到 最 新 的 SSD [ix d, UO 速度 越 来 越 快 , 但 是 价格 也 越 来 越 高 。 
即使 愿意 花 钱 去 买 SSD 盘 ， 怎 么 会 愿意 将 一 些 很 少 
访问 的 数据 放 到 SSD REWE? 好 钢 用 在 刀刃 上 ， 


Dormant 
SSD 般 当 然 应 该 用 来 存放 关键 应 用 的 关键 数据 。 G Archive 
具体 来 说 ， 数 据 温度 与 存储 层次 如 图 5-8 所 示 ， — 


CN " l 图 $-8 ”数据 温度 与 存储 层次 
将 访问 频 棕 但 数据 量 比 较 小 的 “ 热 ” 数 据 存 放 在 SSD B 
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盘 ， 经 常 访问 但 数据 量 比 较 大 的 “上 暖 ” 数 据 放 在 FC/SAS 盘 上 ， 很 少 访问 但 数据 量 最 大 的 “ 冷 ” 
数据 存储 在 SATA 盘 上 。 这 种 存储 层次 需要 利用 分 区 表 技 术 ， 根 据 数 据 热度 将 分 区 存放 到 不 同 
的 表 空 间 ， 而 表 衬 间 容 器 位 于 不 同 的 磁盘 上 。 不 过 ， 随 着 时 间 的 推移 ， 数 据 的 热度 会 冷却 ， 热 
数据 会 变 成 暧 数据 ， 暖 数据 会 变 成 冷 数 据 ， 这 束 需 要 一 种 机 制 在 不 同 的 存储 层次 则 移动 数据 。 

为 了 实现 这 一 需求 ， 基 于 数据 的 价值 和 访问 模式 的 层次 化 存储 管理 方案 应 运 而 生 ， 这 就 是 
DB2 V10 的 新 特性 “多 温度 存储 架构 ”。 这 个 新 架构 还 引入 了 一 个 新 概念 “存储 组 (Storage 
Group) ”， 它 介 于 表 空 间 和 磁盘 之 间 ， 用 来 组 织 性 能 级 别 相同 的 磁盘 。 例 如 ， 将 SSD SE 2H2H 
成 一 个 快速 存储 组 ， 然 后 在 上 面 建 表 空 间 用 于 存储 热 数据 。 

如 图 5-9 所 示 ， 它 结合 了 已 有 的 表 分 区 技术 、 目 动 存储 表 空 间 技术 和 新 的 存储 组 搁 术 ， 对 
多 温度 的 存储 管理 进行 优化 。 模 回来 看 ， 当 前 季度 的 数据 2012Q1 作为 热 数 据 放 在 SSD 盘 上 ， 
而 一 年 之 前 的 数据 则 作为 冷 数据 放 在 SATA RE. 纵 问 可 以 看 到 DB2 对 存储 的 组 织 和 管理 , 最 
底层 是 物理 人 磁盘， 物理 磁盘 被 组 织 成 存储 组 ，“ 热 ”数据 存储 组 为 SG_ HOT，“ 瞬 ”数据 为 
SG WARM, ^A" 数据 为 SG_COLD， 自 动 存储 表 空 间 创建 在 存储 组 上 ， 分 区 家 的 各 分 区 在 
放 在 不 同 的 表 空 间 中 。 


Partitioned 2012Q1 2011Q4 2011Q3 2011Q2 2011Q1 2010Q4... 2006Q3 


table 


Table Table Table Table ... Table 
Automatic Ses m space13  spacel2  — spacell space 13 Ss 12 space 11 


E m nm 再 Em Em um ER 


MA ES. / warm/fs1 spath: x m 


/ hot/fs1 spath: /warm/ fs2 spath: /cold /fs2 
spath: /cold /fs3 


SG HOT SG WARM SG COLD 


Physical 
disk 


图 5-9 ”多 数据 存储 解决 方案 


如 何 实现 这 个 方案 呢 ? 首先 来 看 如 何 创 建 存 储 组 ， 如 下 所 示 ， 创 建 3 个 存储 组 将 相同 性 能 人 夏 
盘 组 织 起 来 ， 其 中 DATA TAG 属性 用 于 标识 数据 访问 的 优先 级 ， 可 以 被 工 作 负 和 载 管理 器 使 用 。 
CR 


CREATE STOGROUP SG WARM ON '/warm/fsl', '/warm/fs2' DATA TAG 5; 
(HEETDIUESESIOGBEOUPES cuc ODDO UAR oo Ta Ca Ou 


然后 ， 根 据 存 储 组 的 特性 和 数据 的 热度 为 各 分 区 创建 表 空间 ， 如 下 所 示 : 


CREATE TABLESPACE Gl 2011 USING STOGROUP SE COLD; 
CREATE TABLESPACE @2 2011 USING STOGROUP SE WARM; 
CREATE TABLESPACE @9 2011 USING STOGROUP SE WARM; 
CREATE TABLESPACE Gd 2011 USING STOGROUR SE WARM; 
CREATE TABLESPACE 可 2012 USING STOGROUP SE HOT; 


174 


第 5 章 ddü6du 


这 时 ， 束 可 以 基于 这 些 表 罕 间 创建 分 区 表 ， 将 各 分 区 放 重 在 不 同 表 空 间 中 ， 如 下 所 未 : 


CREATE TABLE SALES(S SOLD DATE DATE NOT NULL, S CUSTOMER SK INTEGER,...) 
PARTITION BY RANGE(S SOLD DATE) 

(PART 012011 STARTING “2011=01=01" IN @i 2011, 

PARTO ZOE TART O O E T e 2 01bTL. 

PART 032011 STARTING "2011=07=01" IN qə 2011, 

PARTO RN ORE 0 0 

PARTOT ZOT STARTIN 200 Leo ENDING 00 9e SUL v 38g epi 20 

); 


新 的 季度 到 来 时 ， 就 需要 在 存储 组 之 间 移 动 数 据 ， 例 如 将 Q22011 分 区 移 到 冷 存储 组 
SG COLD， 而 将 Q12012 分 区 移 到 暖 分 区 组 ， 这 可 以 通过 下 面 的 命令 简单 实现 : 


ALTER TABLESPACE 2 2011 USING STOGROUP SG COLD; 
ALTER TABLESPACE ql 2012 USING STOGROUP SG WARM; 


NDARA, "DERIAUERBÉTYESUIBSA SG HOT 上 ， 如 下 所 示 : 


CREATE TABLESPACE &2 2012 USING STOGROUP SE HOT; 
ALTER TABLE Sales ADD PARTITION 022012 
STARTING 人 NE 


最 后 ， 总 结 一 下 多 温度 存储 拉 术 带 来 的 好 处 : 

e 可 以 使 用 存储 组 来 组 织 性 能 相同 的 磁盘 ， 构 建 多 温度 存储 层次 ， 将 热 数 据 存储 在 快 设 
备 上 ， 而 将 暧 数据 和 冷 数据 存储 在 较 慢 的 设备 上 。 

e 便捷 的 数据 管理 。 随 看 数据 热度 的 冷 规 ， 需 要 在 人 不同 的 存储 层次 间 移 动 数据 ， 可 以 通 
过 简单 的 修改 表 空 间 的 存储 组 来 实现 。 

e 结合 分 区 表 技 术 和 目 动 存 储 技术 ， 多 温度 存储 技术 具有 很 强 的 实践 意义 。 


5.4 MDC Rigit 


MDC ERA TH H 2 E TEL i2] EE. EESE, IURE 2H 2 A CUR RE E 2C e I b 
fü, EAW where 子 句 中 包含 有 维度 字段 的 得 询 语句 ， 能 够 很 快 地 找到 满足 条 件 的 数据 块 ， 
从 而 显著 近 局 但 询 的 性 能 。 

本 节 将 其 体 探讨 MDC 的 技术 内 项 和 最 佳 实践 。 


5.4.1 MDC 技术 内 幕 


先 看 一 个 MDC 的 具体 例子 , 下 面 定 义 了 一 个 MDC 表 mde sales, f year. nation 和 colour 
这 3 个 维度 组 织 数 据 。 


CREATE TABLE mee sales 
( 
year INT NOT NULL, 
nation CHAR(10) NOT NULL, 
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Colour CHAR(6) NOT NULL, 
re 


) ORGANIZE BY DIMENSIONS (year, nation, colour); 


这 个 表 的 数据 组 织 方式 如 图 5-10 所 示 ， 有 共有 相同 维度 值 的 数据 放 在 一 起 ， 称 之 为 一 个 单元 
(Cell) ， 单 元 中 存储 空间 的 分 配 单位 是 块 〈block) ， 一 个 块 含 有 多 个 数据 页 。 单 元 和 块 是 理 
解 MDC 的 关键 概念 , 单元 是 MDC 组 织 数 扼 的 锡 辑 单位 , 而 块 则 是 MDC 分 配 空 间 的 物理 单位 。 


AS 注 意 : 什么 是 块 〈block ) E 
块 的 另 一 个 名 字 为 扩展 块 (EXTENT )， 块 的 大 小 在 创建 表 空 间 时 指定 ， 如 下 所 示 ， 
表 空 间 定 义 语句 指定 块 的 大 小 为 32 个 页 : 
GRIN ET EN ST 
块 是 存储 空间 的 分 配 单位 ， 也 就 是 说 为 MDC 的 单元 增加 存储 空间 时 ， 一 次 增加 一 
个 块 , 而 不 是 新 增 一 个 页 .为 了 最 大 的 IO 性 能 , 块 的 大 小 (EXTENT SIZE ) 应 该 和 STRIPE 
SIZE 相 匹 配 (相等 或 整数 倍 )， 请 参考 第 3 章 3.3.3 T. 


G 注意 : 不 要 使 用 具有 唯一 性 的 字段 作为 维度 ; 
这 样 会 导致 一 个 表 所 占用 的 空间 急剧 膨胀 ,原因 是 每 个 单元 格 的 空间 分 配 单位 是 块 ， 
即使 这 个 单元 格 中 只 有 一 行 数据 ， 也 会 占据 一 个 块 的 空间 。 


DB2 为 MDC 的 每 个 维度 自动 地 建立 块 索引 (BLOCK INDEX) ， 即 以 块 为 基本 单位 建立 
有 索引。 普通 表 的 行 索引 (RID INDEX) 以 数据 行 作 为 基本 单位 建立 索引 树 。 图 5-11 非常 直 观 地 
体现 了 MDC 的 块 索引 和 羡 通 表 的 行 索 引 的 区 别 。 


f LL —L 
JM Za J 
个 2/N 437 pn TH 
yg 3 — ^P 38 9| n 


nation 


维度 


[]= Row |] = Extent (block) 
图 5-10 MDC 的 数据 组 织 图 5-11 块 索引 和 行 索引 


比较 : 块 索引 和 普通 索引 的 异同 操 


有 三 个 重要 区 别 : 第 一 ， 块 索引 指向 的 是 块 ， 普 通 索 引 指 向 的 是 记录 ; 第 二 ， 每 个 块 包含 
了 许多 页 的 记录 ， 所 以 块 索引 比 行 索引 要 小 很 多 ; 第 三 ， 只 在 新 块 添加 到 单元 ， 或 者 某 些 块 需 
要 从 单元 删除 的 时 候 ， 才 需要 被 更 新 ， 因 此 ， 块 索引 需要 的 日 志和 维护 方面 的 开销 更 小 。 

它们 之 间 也 有 相同 点 : DB2 优化 器 会 像 处 理 普通 索引 一 样 对 待 块 索引 ， 块 索引 之 间 也 可 以 
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进行 AND 和 OR 操作 ， 也 可 以 和 普通 索引 进行 组 合 操作 。 


MDC 通 闻 用 于 提高 对 大 型 琢 进 行 复 杂 碍 询 的 性 能 ， 特 别 适 合 那些 在 维度 上 做 聚集 计算 的 
查询 。 例如 : 
SELECT SUM (cquanticy) FROM mele sales 


WHERE year = 2011 
GROUP BY nation, colour; 


最 后 ， 总 络 一 下 MDC RART R Rp ARE Ab: 

首先 ，MDC 将 维度 值 相 同 的 数据 组 织 在 一 起 ， 这 样 数据 更 加 有 序 从 而 提高 IO deut fe 

其 人 次， 聚集 是 目 动 维护 的 ， 在 数据 插入 的 过 程 中 ，MDC 会 动态 地 省 理 和 维护 数据 的 聚集 
性 ， 这 样 就 不 需要 REORG 来 维护 数据 的 聚集 了 。 

最 后 ，MDC 通过 各 维度 上 的 块 索 引 提 高 查询 语句 的 性 能 ， 而 且 块 索引 比 行 索引 占用 的 空 
间 更 小 ， 效 率 更 高 。 


5.4.2 MDC Rigit RIEKE 


在 MDC 表 中 ， 每 个 单元 都 会 根据 需要 来 分 配 存储 块 ， 而 块 大 小 即 为 表 空 间 的 扩展 块 大 小 。 
如 果 MDC 维度 列 选 择 不 当 ， 千 成 单元 数目 过 多 ， 那 么 即使 某 些 单元 仪 存储 一 条 记录 ，DB2 也 
会 给 这 些 单 元 分 配 独 立 的 存储 块 ， 这 样 束 会 造成 一 定 的 空间 浪费 。 由 于 需要 读 入 一 些 空白 页 ， 
这 将 导致 性 能 下 降 。 

关于 MDC 的 设计 ， 有 下 面 一 些 注 意 事 项 。 

(1) 选择 合适 的 维度 列 。 

e 考虑 性 能 关键 的 查询 语句 ， 关 注 WHERE 条 件 中 等 于 谓词 或 范围 谓词 所 引用 的 列 ， 以 

及 GROUP BY 和 ORDER BY 引用 的 列 ， 可 以 作为 候选 的 维度 列 。 
e 考虑 具有 清晰 区 分 度 但 基数 不 大 的 列 ， 例 如 月 份 、 星 期 、 地 区 、 和 省 份 或 者 部 门 都 可 以 
作为 候选 的 维度 列 ， 避 免 选择 主键 或 者 基数 很 大 的 列 。 

e 事实 表 上 的 外 键 列 也 可 以 作为 候选 的 MDC 键 。 

(2) 不 要 选择 太 多 的 维度 。 维 上 度 越 多 ， 单 元 个 数 束 会 以 指数 级 速度 相应 地 增长 ， 从 而 产 
生 大 量 的 存储 需求 。 如 果 表 的 存储 空间 过 度 脱 胀 (例如 超过 常规 表 的 两 倍 大 小 ，，MDC 会 因为 
Mii BEA) 的 IO 增加 而 使 聚集 失去 优势 。 

(3) 通过 生成 列 (generated column) 的 方法 来 减少 单元 数量 ， 避 人 免 空间 浪费 。 例 如 ， 基 
于 日 期 字段 创建 月 份 或 星期 生成 列 ; 或 者 用 Col/100 来 代替 Col 作为 维度 列 ， 这 样 ， 一 个 单元 
中 的 数据 会 明显 增多 ， 有 利于 空间 利用 。 

(4) 适当 减少 块 大 小 ， 能 相对 减少 单元 中 的 空间 空 间 。 块 的 大 小 需要 在 创建 表 空间 时 用 
EXTENTSIZE 子 句 指定 。 

(5) 使 用 db2advis 来 辅助 MDC 的 设计 。 

最 后 ， 通 过 一 个 订单 表 MDC ORDER 的 例子 说 明 MDC 键 的 选择 。 一 个 公司 经 营 20 类 共 
vF 10000 种 产品 ， 销 售 区 域 大 约 30 个 省 ， 订 单 表 含 有 销售 日 期 学 段 sold date. 
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e 如 果 以 (product，province，sold date) 作为 MDC 键 ， 一 年 的 数据 总 共有 1 亿 个 单元 
《10000X30X365=10950000) ， 这 极 可 能 导致 很 多 秘 芯 块 或 空 页 ， 造 成 空间 当 费 。 

e 如 果 订 单 表 的 数据 量 更 小 些 ， 可 以 用 (category，province) 作为 MDC 键 ， 这 时 共有 
600 个 单元 (20X30=600) 。 

e WLI Ccategory, province, year mon) 作为 MDC 键 ， 一 年 的 数据 估计 有 7200 个 单 
75 (20X30X12-72000 ， 当 订单 表 的 数据 行 数 达 到 几 亿 行 ， 这 个 MDC 键 的 选择 是 合 
适 的 。 目 前 这 个 表 的 记录 数 为 3 亿 左 右 ， 所 以 ， 最 终 选择 了 这 3 个 列 作为 MDC 键 ， 其 
中 year mon 为 生成 列 。 


CREATE TABLE MDC ORDER 
( 
SOLD DATE DATE, 
DEUS ARCE 
BRODU CHEET UNCER 
CATEGORY TNTEGER, 


YEAR MON generated always as (INTEGER(SOLD DATE) /100) 
ORGANIZE BY DIMENSIONS (CATEGORY, PROVINCE, YEAR MON); 


没有 办 法 直接 修改 分 区 键 ， 因 为 分 区 键 的 选择 涉及 到 数据 库 表 的 设计 问题 ， 并 且 一 
旦 建立 就 决定 了 数据 如 何 分 布 ， 就 只 能 使 用 表 重 建 的 方式 来 修改 分 区 键 。 


5.4.3 案例 :“ 吃 磁盘 ”的 MDC X 


在 我 接触 到 的 客户 中 ， 不 少 客户 使 用 MDC 来 提高 性 能 。 然 而 ， 设 计 MDC 表 时 ， 维 度 键 的 
选择 至 关 重 要 ， 稍 有 不 慎 ， 不 仅 没 能 带 来 性 能 上 的 提高 ， 还 会 发 现 MDC 表 在 疯狂 的 “ 吃 磁盘 ”。 

在 一 次 给 某 电信 企业 做 数据 仓库 方面 的 技术 服务 时 ， 就 遇 到 过 由 于 MDC 键 选择 不 当 ， 写 
致 占用 空间 过 大 。 那 是 一 个 从 Oracle 迁移 到 DB2 上 的 系统 ， 在 Oracle 5 DB2 的 对 比 测试 中 ， 
RIK TB_MK_DAY (只 包含 测试 所 用 的 部 分 数据 ) 在 Oracle 中 压缩 后 占用 的 空间 只 有 480M, 
而 到 了 DB2 里 压缩 后 竟 占 用 了 2.7GB 存储 空间 。 整 个 表 TB MK _DAY( 包 含 全 部 数据 ) 在 Oracle 
上 为 20G， 而 迁移 到 DB2 的 库 竟 然 达到 120G。 一 时 找 不 到 原因 ， 客 户 甚 至 为 此 事 向 IBM 开 出 
了 问题 报告 (PMR)〉。 而 现场 的 工程 师 们 一 开始 都 怀疑 是 DB2 的 数据 压缩 特性 有 问题 。 

为 什么 迁移 到 DB2 后 ， 这 个 表 会 疯狂 地 “ 吃 人 磁盘 ” 呢 ? 下 面 一 一 讲述 。 

首先 ， 在 数据 迁移 后 的 生产 库 上 (包含 TB MK DAY 的 全 部 数据 ) ， 基 于 最 新 的 统计 信 
息 ， 从 SYSCAT.TABLES 查询 其 相关 数据 ， 如 下 所 示 : 


select card,npages, fpages, compression,avgrowsize from syscat.tables where 
tabname=" TB MK DAY" and tabsehemas= "MASA" 


CARD NPAGES FPAGES COMPRESSION AVGROWSIZE 


223336040 464218 3878040 R 58 
针对 上 和 面 的 查询 结果 ， 用 下 面 的 公式 计算 ,可 以 看 出 ， 此 表 占 用 的 总 空间 为 FPAGESX 


178 


第 5 章 ddü6du 


32KB ( 约 118.35GB) 要 远 远 大 于 表 中 实际 行 数 所 需要 的 空间 CARDX AVGROWSIZE (ZJ 
12.06GB) ， 而 浪费 的 空白 页 比率 达到 88%， 其 中 这 个 数据 库 的 页 大 小 为 32KB. 


表 占 用 的 总 空间 : FPAGES * 32KB = 3878040 * 32KB = 118.35 GB 

E HXUEBH AGE * 32KB 64 1 * 32KB -» 14.17 GB 

JidsfrHJI BERI: CARD* AVGROWSIZE = 223336040 * 58 bytes - 12.06 GB 
"BEAZEE: FPAGES - NPAGES - 3413822 

浪费 的 空间 比率 ; (FPAGES - NPAGES) / FPAGES = 88$ 


经 调查 ， 得 知 TB MK DAY 在 Oracle 上 为 哈 希 分 区 表 ， 迁 移 到 DB2 上 设计 为 MDC X, 
而 MDC HN £^ Et CEIL_ ID 。 进 一 步调 查 , 用 如 下 语句 分 别 在 测试 库 和 生产 库 上 查询 CEIL_ID 
的 基数 ， 发 现 测试 库 上 CEIL ID 包含 6000 个 不 同 的 值 ， 而 生产 库 上 约 为 235000。 


SELECT COUNT (DISTINCT IBI TD») FROM MASA o TB MK DAY% 


最 后 ， 确 认 了 存放 TB_MK_DAY Ilze^x REA 2g 16, 34A EAE YR R EAIN: 
6000X16X32KB=2.9G， 而 现在 表 占 用 的 空间 为 2.7G. "EP FEIRSTEHJARIRISOAS, GBA EB 
Ds 

到 这 里 ， 问 题 的 原因 已 经 清楚 了 ， 这 是 由 于 MDC 键 选 择 不 当 导 致 的 。 根 据 前 面 的 最 佳 实 
践 ， 在 设计 MDC 表 时 ， 应 该 选择 具有 区 分 度 但 基数 不 大 的 列 作 为 MDC 键 。 

针对 这 个 表 ， 可 以 考虑 用 其 他 列 做 MDC 键 或 取消 对 这 个 表 做 MDC 分 区 。 最 终 的 解决 办 
法 是 ， 选 择 了 其 他 基数 小 的 列 做 MDC 键 并 重建 这 个 表 ， 经 过 在 测试 库 上 的 验证 ， 发 现 对 创建 
后 的 表 进 行 压 缩 ， 空 间 减 为 380MB， 这 上 比 Oracle 的 效果 还 要 好 ! 


/A 注意 : Oracle 与 DB2 的 分 区 技术 JE 
Oracle 的 分 区 技术 与 DB2 的 分 区 技术 并 不 一 样 ， 在 做 分 区 转换 时 ， 应 该 充分 理解 两 
者 分 区 技术 的 特点 和 区 别 ， 千 万 不 要 像 这 个 案例 一 样 ， 将 Oracle 的 输 布 分 区 简单 地 转换 


成 DB2 的 MDC R. 


5.5 分 区 技术 对 比 : DB2 vs Oracle 


Oracle 和 DB2 所 支持 的 分 区 特性 有 相似 之 处 ， 也 有 一 定 区 别 。 为 方便 读者 理解 ， 表 5-2 以 
对 比 的 方式 介绍 了 Oracle 和 DB2 这 两 种 数据 库 的 分 区 特性 ， 请 特别 关注 用 法 上 的 异同 之 处 。 
当然 ， 与 DB2 一 样 ， 这 些 分 区 特性 在 Oracle 中 既 可 以 单独 使 用 ， 也 可 以 组 合 使 用 。 


表 5-2 Oracle 和 DB2 分 区 特性 比较 
Oracle DB2 DB2 语法 


哈 希 分 区 DPF PARTITION BY HASH DISTRIBUTE BY HASH 


范围 分 区 表 分 区 PARTITION BY RANGE PARTITION BY RANGE 


( Range Partitioning) 
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( 续 表 ) 


Oracle DB2 DB2 语法 


列表 分 区 带 生 成 询 | PARTITION BY PARTITION BY 
(List Partitioning ) 的 表 分 区 LIST RANGE 


N/A N/A ORGANIZE BY DIMENSIONS 


O 注意 ;系统 分 区 和 引用 分 区 
Oracle 还 支持 系统 分 区 、 引 用 分 区 等 特性 ， 这 在 DB2 中 没有 相对 应 的 概念 。 


1. EENE 
DB2 的 哈 希 分 区 (CBU DPF 分 区 ) 5 Oracle 的 哈 希 分 区 有 痢 很 大 的 不 同 。 
人 注意 : 不 同 的 哈 希 分 区 E 
DB2 的 DPF 采用 Share-Nothing 的 体系 结构 , 它 扩 展 了 存储 和 计算 能 力 , 包括 CPU. 


内 存 和 存储 等 。Oracle 则 是 采用 Share-Disk (共享 磁盘 ) 的 体系 结构 ， 利 用 哈 希 分 区 将 
数据 分 布 到 不 同 的 表 空 间 中 ， 提 高 /O 并 行 性 。 


Oracle 使 用 如 下 所 示 的 PARTITION BY HASH 子 句 来 建立 哈 希 分 区 ， 其 中 哈 希 键 为 
S ID， 共 创建 了 4 个 分 区 ， 分 别 存放 于 不 同 的 表 空 间 中 。 


CREATE CTABIERBSCSAITRS 
S ID BIGINT NOT NULL, 
S9 SOLD DATE DATE NOT NULL; 
SEEODUCI E EO 
S9 CUSTOMER SK INTEGER, 
S9 REGION CHAR(3); 
S QUANTITY INTEGER) 

PARTITION BY HASH(S ID) 

(partition p1 tablespace tbspl, 


partition p2 tablespace tbsp2, 
partition p3 tablespace tbsp3, 
partition p4 tablespace tbsp4 
) 


那么 DB2 中 是 如 何 创建 呢 ? ui Br. WAE S ID 字段 做 分 布 键 ， 根 据 S ID 的 哈 希 
值 将 数据 分 布 到 各 节点 上 ， 其 中 ts_data_4n 是 路 4 个 节点 的 表 空 间 。 


CREATE TABLE SALES ( 
S ID BIGINT NOT NULL, 
S5 SOLD DATE DATE NOT NULL, 
S PRODUCT SK INTEGER NOT NULL, 
S CUSTOMER SK INTEGER; 
S9 REGION CHAR(3) ; 
S QUANTITY INTEGER) 
IN TABLESPACE ts data 4n 
DISTRIBUTE BY HASH(S ID) 
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2. 范围 分 区 
表 分 区 的 数据 组 织 形式 是 按照 一 个 或 多 个 字段 将 数据 分 布 到 多 个 表 空 间 上 ， 每 个 表 空 间 独 


芯 存 放 表 分 区 数据 。 
如 下 所 示 ， 在 Oracle 中 为 表 Sales 创建 同样 表 分 区 的 语句 : 


CREATE TABLE SALES( 
S ID BIGINT NOT NULL, 
S _ SOLD DATE DATE NOT NULL, 
SOSEJSQUDU COTON E ECE TO O 
S CUSTOMER SK INTEGER, 
S REGION CHAR (3), 
S QUANTITY INTEGER) 


PARTITION BY RANGE (S_SOLD_DATE) 
(PART Q1 2012 VALUES LESS THAN (TO DATE('2012-03-31','YYYY-MM DD')) TABLESPACE TBSP1, 


PART Q2 2012 VALUES LESS THAN (TO DATE('2012-06-30','YYYY-MM DD')) TABLESPACE TBSP2, 
PART Q3 2012 VALUES LESS THAN (TO DATE('2012-09-30','YYYY-MM DD')) TABLESPACE TBSP3, 
PART Q4 2012 VALUES LESS THAN (TO DATE('2012-12-31','YYYY-MM DD')) TABLESPACE TBSP4) 


在 DB2 中 为 表 Sales 创建 表 分 区 如 下 所 示 , 其 中 使 用 S. SOLD. DATE 作为 分 区 字段 ,每 个 
季度 作为 一 个 分 区 ; 


CREATE TABLE SALES( 

S ID BIGINT NOT NULL, 
S SOLD DATE DATE NOT NULL, 
i dels OUDIUNC Po N GENTOO 
SUID POMmS SK CTNIPBGRR 
DESSEN OPENED 
S QUANTITY INTEGER) 

PARTITION BY RANGE (S_SOLD_DATE) 
(PART Q1_2012 STARTING '2012-01-01' ENDING '2012-03-31' IN TBSP1, 
PART Q2 2012 ENDING '2012-06-30' IN TBSP2, 
PART Q3 2012 ENDING '2012-09-30' IN TBSP3, 
PART Q4 2012 ENDING '2012-12-31' IN TBSP4) 


3. 列表 分 区 (List Partitioning) 


列表 分 区 是 Oracle 中 的 概念 ， 其 本 质 和 范围 分 区 一 样 ， 都 是 将 数据 存放 到 多 个 表 分 区 ， 区 


别 只 是 分 区 字段 值 是 通过 枚 举 出 来 的 。 如 下 所 示 ， 在 Oracle 数据 库 中 将 表 customer 创建 为 列表 


分 


xl 


CREATE TABLE CUSTOM N 
cust ic int, 
cust country cnar (2) ) 
PARTITION BY LIST (cust prov) 
(PARTITION p_ ea VALUES CN "JB"; “RR) ; 
PARTITION p na VALUES (US, "“CA"); 
PARTITION p eu VALUES (“EN"; "IT"; "DE"; "ER"; “RU"); 
PARTITION p remain VALUES (DEFAULT) ) 


DB2 可 以 通过 表 分 区 的 方式 来 实现 , 具体 来 说 , WRM ERY] (generated column) , 
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并 以 此 生成 列 作 为 分 区 字段 。 一 种 实现 方法 如 下 所 示 , 在 表 customer 中 产生 生成 列 cust ctr gen; 
随后 创建 范围 分 区 ， 从 而 达到 和 Oracle 列表 分 区 同样 的 效果 : 


CREATE TABLE CUStOmer( 

cust ic INT, 

cust country CHAR (2) 

cust ctr gen GENERATED ALWAYS AS 


(CASE CUSE COUNEEY 


WEEN “CNY THEN 1 
WEEN JPY THEN 1 
WHEN  'KR' THEN 1 
WHEN “US” THEN 2 
WHEN  'CA' THEN 2 
WHEN  'EN' THEN 3 
WHEN 'IT' THEN 3 
WEEN YDE" THEN 3 
WEHEN "PR" THEN 3 
WHEN “RU” THEN 3 
ELSE 4 
END) 


) 
PARTITION BY RANGE (cust_ctr_gen) 
(STARTING 1 ENDING 4 EVERY 1) 


多 注意 : 分 区 字段 的 值 要 稳定 才 行 

当然 ， 这 种 方式 一 般 要 求 分 区 字段 的 值 域 是 相当 稳定 的 ， 例 如 部 门 、 地 区 等 。 笔 者 
曾经 遇 到 一 个 全 例 ， 客 户 要 求 将 Oracle 的 列表 分 区 转换 成 DB2 中 的 表 分 区 ， 但 是 列表 
区 字段 是 时 间 ， 那 么 这 种 转换 方式 就 行 不 通 


Np nm 


4. 多 维 集群 


DB2 中 的 MDC 表 按 照 多 个 维度 来 分 块 组 织 数据 ， 例 如 产品 、 时 间 ， 区 域 等 。 如 下 所 示 ， 
在 DB2 中 创建 了 MDC 表 Sales， 其 中 以 字段 S PRODUCT SK 和 SS REGION 作为 维度 列 : 


CREATE TABLE SALES( 
S ID BIGINT NOT NULL, 
S SOLD DATE DATE NOT NULL, 
SD Ne Ny 
S CUSTOMER SK INTEGER, 
ess eo PIED 
S QUANTITY INTEGER) 
ORGANIZE BY DIMENSIONS (S_PRODUCT_SK, S_REGION) 


在 Oracle 中 ， 并 没有 与 MDC ENER. HARR RIER (Cluster Table) 和 索引 组 织 表 
(Index Organization Table, IOT) 与 MDC 技术 混 清 ， 它 们 是 完全 不 同 的 技术 。 
Cluster Table 技术 是 存储 一 组 表 的 方法 。 这 些 表 具有 某 些 相同 的 学 段 且 更 新 矣 率 不 局 ， 而 
经 党 在 这 些 字 段 上 做 连接 合 询 ， 于 是 就 把 这 些 不 同 表 在 这 些 连接 字段 上 上 共有 相同 值 的 数据 行 存 
储 到 同一 块 上 ， 从 而 提高 性 能 。 
索引 组 织 表 则 是 将 数据 行 按 表 的 主键 顺序 来 组 织 数据 ， 索 引 段 束 包 括 了 所 有 数据 行 。 
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5. 组 合 方式 (Combining Methods? 


在 实际 应 用 中 可 以 将 上 面 的 这 些 分 区 特性 组 合 在 一 起 使 用 ， 以 满足 多 样 化 的 应 用 需求 。 
Oracle 可 以 哈 希 、 范 围 、 列 表 等 组 合 ，DB2 中 可 以 DPF、 表 分 区 分 区 和 MDC 组 合 。 这 样 以 应 
H DPF 获得 扩展 性 ， 并 确保 在 逻辑 分 区 之 间 均 匀 分 布 数据 ; 表 分 区 的 转 入 转 出 能 力 可 以 方便 数 
据 管理 ， 而 分 区 排除 技术 能 提高 查询 性 能 ，MDC 可 以 用 来 数据 聚集 和 提高 查询 性 能 。 

如 下 所 示 ，Oracle FÆ Sales 按照 S SOLD DATE 字段 将 每 年 的 数据 分 布 到 不 同 的 范围 分 
区 ， 对 于 每 个 范围 分 区 又 按照 S ID 字段 散 列 到 各 个 子 分 区 中 : 


CREATE TABLE SALES( 
S ID BIGINT NOT NULL PRIMARY KEY, 
S _ SOLD DATE DATE NOT NULL, 
S _ PRODUCT SK INTEGER NOT NULL, 
S CUSTOMER SK INTEGER, 
SRECNE CEARD 
S QUANTITY INTEGER) 
PARTITION BY RANGE (S_SOLD_DATE) 
SUBPARTITION BY HASH(S_ID) SUBPARTITIONS 2 
(PART parti VALUES LESS THAN (TO DATE (“2011=03=31" MD 
(PUES EEN 
SWEAR UN 
PART PART2 VALUES LESS THAN (TO DATE (“2012=06=30" , "YYYY=MM DD’),) 
CURRERE ONE 
SUBPARITION part22),; 
PART PARTS VALUES LESS THAN (TO DATE (“2012=09=30" , "YYYY=MM DD’),) 
GUS RARISNONE c OE Sd 
SUBPARITION part2); 
PART PARTA VALUES LESS THAN (TO DATE (“2012=12=31" , “YYYY=MM_ DD") ) 
(SUBBARITION DaEEE41， 
SUBEAESTTPONOSOGEEAA ) 5 


而 相应 的 分 区 设计 在 DB2 中 显得 更 为 简单 ， 如 下 所 不 : 


CREATE TABLE SALES( 
S ID BIGINT NOT NULL PRIMARY KEY, 
o OLD DATA PATI NOL NUCL, 
S PRODUCT SK INTEGER NOT NULL , 
S CUSTOMER SK INTEGER, 
S REGION CHAR(5), 
S QUANTITY INTEGER) 
DISTRIBUTE BY HASH(S ID) 
PARTITION BY RANGE(S SOLD DATE) 
( PART Q1 2012 STARTING MINVALUE ENDING '2012-03-31' IN q1 2012, 
PART Q2 2012 ENDING '2012-06-30' IN q2 2012, 
PART Q3 2012 ENDING '2012-09-30' IN q3 2012, 
PART Q3 2012 ENDING '2012-12-31' IN q3 2012); 


在 DB2 中 ，DPF、 表 分 区 和 MDC 技术 可 以 同时 应 用 到 一 个 表 的 设计 中 。 如 图 5-12 所 示 ， 
从 纵向 看 ， 表 的 数据 分 布 在 3 个 数据 库 分 区 上 ,而 从 横向 看 , 表 的 数据 按照 月 份 进行 范围 分 区 ， 
而 MDC 技术 的 使 用 又 将 相同 特征 的 数据 组 织 在 一 起 。 


183 


BN DB2 设计 、 管 理 与 性 能 优化 艺术 


uds 
essais hus 


K 5-12 DPF. 2R fe MDC 


结合 DPF、 表 分 区 和 MDC 三 种 技术 的 SALES 表 设 计 如 下 所 示 : SALES KE S ID 上 散 列 


分 


} 布 到 各 个 数据 库 节 点 上 ; 并 在 S SOLD DATE 上 按 季 度 进 行 范 围 分 区 ， 存储 在 不 同 的 表 空 间 


E; 同时 SALE 表 在 S PRODUCT SK 和 S REGION 列 上 进行 多 维 集群 。 


CREATE TABLE SALES( 
S ID BIGINT NOT NULL, 
S9 SOLD DATE DATE NOT NULL; 
OER ODUCT ENS TONO 
S CUSTOMER SK INTEGER, 
DE sco HAE 
S QUANTITY INTEGER) 
DISTRIBUTE BY HASH(S ID) 
PARTITION BY RANGE (S_SOLD_DATE) 


( PART Q1 2012 STARTING "“2012=01=01 
PART Q2 2012 STARTING DIE 

/ Xw ge 2012; 

' ENDING '2012-12-31' IN q4 2012) 


PART Q3 2012 STARTING "2012=-07=01 
PART Q4 2012 STARTING "20]12=10=01 


ORGANIZE BY DIMENSIONS (S PRODUCT SK, 


IN qi 2012, 
I g2-2912; 


S REGION); 


5.6 MQT iit 


MQT Æ LA f if £i A 7 dixe XI — RUE. 3ex8 LAS JB], MOT 是 将 查询 结果 保存 
到 物理 磁盘 上 。 当 一 个 复杂 查询 到 达 时 ，DB?2 优化 器 确定 整个 查询 或 查询 一 部 分 是 否 可 以 用 一 
个 MQT 来 处 理 ， 于 是 用 MQT 重 写 查询 ， 这 样 DB2 直接 使 用 MOT 中 的 这 些 数据 ， 而 不 是 使 用 


基本 表 的 数据 进行 重新 计算 ， 这 样 可 以 显著 捉 高 复杂 奉 询 的 性 能 。 
MQT 最 大 的 优势 在 于 无 须 改 变 应 用 程序 代码 ， 殉 能 提高 复杂 得 询 的 啊 应 时 间 , "E OLAP 


环境 中 取得 了 非常 广泛 的 应 用 。 
5.6.1 MQT 的 能 


在 笔者 经 历 的 一 个 银行 应 用 调 优 中 ， 月 未 报表 的 得 询 瓶 颈 在 于 一 个 8 亿 条 记录 的 大 表 ， 在 
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该 表 上 建立 了 5 个 MQT 后 ， 将 其 中 一 个 报表 的 性 能 从 1 小 时 15 275 EU 10 分 钟 以 内 ， 而 对 
该 表 上 批量 数据 小 载 的 性 能 有 影响 不 大 ， 完 全 消除 了 最 初 对 MQT 会 影响 数据 闭 载 性 能 的 担忧 。 

下 和 面 用 一 个 例子 来 说 明 ， 下 面 的 SQL 语句 得 询 每 年 的 销售 总 量 ， 在 没有 MQT 的 情况 下 ， 
从 访问 计划 上 可 以 看 出 ， 两 个 表 先 做 JOIN 然后 再 做 聚集 SUM 运 得 ， 优 化 右 估 计 的 开销 为 
2547.67. 


Original Statement: 

SELECT YEAR (TX paate) tx y, SUM(TI amount) ti amnt 
FROM TRANS TX, TRANSITEM TI 

WHERE TI transie = TX, transa 

GROUP BY YEAR (TX.pdate) 


Optimized Statement: 
SELECT 04.$C1 AŞ MK Wy Q4.9CO AS “TI AMNT™ 
FROM 
(SELECT SUM (03. $1), 03. $C0 
FROM 
(SELECT (DA OL, AMOUNT 
BIENES INSERIRE A RANS ue 
WEERE (O1, TRANSID = 02.TRANSID)); AS 03 
SROUPSELSOSSOCOURSEOA) 


Access Plan: 
TPotal Cosb: 2547.67 


Query Degree: 1 


Rows 
RETURN 
(C — d) 
COST 
I/O 

| 

12 
GRPBY 
(2 
2547.44 
188 

| 

12 
GRPBY 
( 2) 
2547.44 
188 

| 

12 
TBSCAN 
( 3) 
uod 
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188 
| 
12 
SOR 
( 4) 
go TREES 
188 
| 
10000 
HSJOETN 
(5) 
2005.45 
188 
/------ +----- \ 
10000 5001 
TBSCAN TBSCAN 
(6) (m 
1178.6 641.591 
116 12 
| | 
10000 5001 
TABLE: STARS TABLE: STARS 
TRANSITEM TRANS 


这 时 创建 一 个 MQT, iX MQT 统计 交易 表 上 每 个 月 份 的 销售 总 量 ， 并 在 MQT 上 创建 索引 ， 
最 后 运行 runstats 命令 更 新 统计 信息 。 
CREATE TABLE SALES BY MONTH AS 
( SELECT XBAR(TX place) Tx _ year, MONTH (TX. padare) Tx month, 
COUNT (*) item cnt, SUM(TI amount) 七 @ 巧 有 二 

FROM TRANS TX, TRANSITEM TI 

WHABRE TI. Cransicd = TX. transiidi 

GROUP BY YEAR(TX.pdate), MONTH (TX.pdate)) 


DATA INITIALLY DEFERRED 
REFRESH IMMEDIATE; 


REFRESH TABLE SALES BY MONTH; 
CREATE INDEX SALES BY MONTH IX ON SALES BY MONTH (Tx year, Tx monis) 


RUNSTATS ON TABLE SALES BY MONTH 
WITH DISTRIBUTION AND DETAILED INDEXES ALL; 


下 面 的 访问 计划 是 创建 MQT 之 后 的 结果 ， 可 以 看 到 : DB2 优化 器 用 MQT 重 写 了 原来 的 
SQL 查询 语句 ， 并 直接 从 MQT 读 取 数据 ， 这 样 使 用 MQT 的 访问 计划 没有 了 JOIN 操作 ， 整 个 
查询 的 开销 变 为 34.6916， 远 远 小 于 原来 的 开销 。 这 融 是 MQT 的 能 力 ! 


Original Statement: 

SELECT YEAR(TX padare) tx y, SUM(TI amount) ti amnt 
FROM TRANS TX, TRANSITEM TI 

WHERE TI.transid = TX, transie 

GROUP BY YEAR(TX.pdate) 
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Optimized Statement: 


NE 


FROM 
(Sm SU MEO M 


FROM 
(SELECT DIM X; TE AMNT 
HEROVER S SE OSO 


AS Q3 


AS Q2 
SROUPSBYISO2SSC0 


Access Plan: 


Total Coste: 34.6916 
1i 


Query Degrees 


Rows 
RETURN 
( 1) 
COST 
A 
| 
n 
GRPBY 
2 
34.5474 
1 
| 
TAN 
TBSCAN 
(o 3) 
34.4664 


gl 
TBSCAN 
= 
alee l 
1 
| 
a 
TABLE: STARS 
SALES_BY MONTH 


OI 
5.6.2 ”创建 MQT 必须 掌握 的 要 点 
MQT 通过 CREATE TABLE 语句 来 创建 ，MQT 中 引用 的 表 称 为 基本 表 。 图 5-13 展示 了 创 


££ MQT 的 详细 语法 ,其 中 标 有 下 划 线 的 选项 是 款 认 选项 , 即 MQT SA 8 £8 7j MAINTAINED BY 
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SYSTEM, REFRESH DEFERRED 和 ENABLE QUERY OPTIMIZATION， 下 面具 体 谈 谈 这 些 选 
项 的 含义 。 


CREATE TABLE «Name» AS 用 户 提供 的 MOT 名字 
( 
XSELECT statement» 定义 MQT 的 SELECT 语 句 ， 决 定 MQT 的 内 容 


) 
刚 创建 时 ，MQT 是 空 的 


图 5-13 MQT 语法 


e DATA INITIALLY DEFERRED: 这 是 必需 的 选项 ， 表 示 在 执行 CREATE TABLE 语句 
时 ， 并 不 将 数据 插入 到 表 中 。MQT 被 创建 好 后 ， 处 于 检查 暂 挂 (check pending) 状态 ， 
在 对 它 执 行 SET INTEGRITY 语句 之 前 ， 不 能 租 询 它 。 执 行 SET INTEGRITY 时 ，DB2 
根据 MQT 的 三 询 定义 对 数据 进行 检 人 租 ， 并 将 得 询 结 末 填充 到 MQT. 

e MAINTAINED BY [ SYSTEM | USER]: 包括 系统 维护 和 用 户 维 护 两 种 。 系 统 维护 的 
MQT， 不 允许 用 户 对 MQT 做 IUD CInsert. Update 或 Delete) 操作 ， 基 本 表 的 数据 更 
改 通 过 菏 种 机 制 目 动 刷新 到 MQT 中 ， 大 多 数 应 用 的 MQT 都 创建 为 系统 维护 ;用 户 维 
J^] MQT 则 是 由 用 户 通 过 IUD 或 者 LOAD 操作 装 入 数据 ， 可 以 用 在 时 效 要 求 较 低 的 
应 用 中 。 

e REFRESH [ DEFERRED | IMMEDIATE ]: 包括 延 时 刷新 和 即时 刷新 两 种 。 延 时 刷新 需 
要 通过 命令 REFRESH TABLE 语句 来 刷新 , 即时 刷新 表示 基本 表 的 IUD PRESE OK IS C 
据 更 新 立即 被 刷新 到 MQT。 系 统 维护 MQT 采用 延 时 刷新 对 基本 表 的 影响 很 小 ， 对 于 
用 户 维护 MQT， 只 能 采用 即时 刷新 。 

e [ENABLE | DISABLE ] QUERY OPTIMIZATION: 是 否 允 许 DB2 优化 器 使 用 该 MQT 
来 优化 复杂 的 查询 。 一 般 来 说 ， 使 用 MQT 进行 查询 优化 是 创建 MQT 的 动机 ， 也 有 一 
些 场合 应 用 程序 直接 查询 MQT 中 的 数据 。 


5.6.3 ARA Wie MQT 的 刷新 机 制 


在 现实 使 用 中 ,用 的 最 广泛 的 是 系统 维护 的 MQT， 它 在 提高 复杂 查询 性 能 的 同时 , 会 将 基 
本 表 的 数据 更 新 传播 到 MQT， 上 所 以 对 基本 表 有 一 定 影响 。 很 多 读者 非常 关心 ， 这 种 影响 到 抵 有 
多 大 ? 其实 这 和 它 的 刷新 时 机 有 关 。 
e 即时 刷新 : 增 量 刷新 方式 ， 用 于 对 时 效 性 要 求 高 的 场景 ， 但 是 对 高 负载 的 OLTP 应 用 
会 有 一 定性 能 影 啊 。 
e 延 时 刷新 : 全 量 刷新 方式 ， 导 臻 MQT 的 数据 与 基本 表 的 数据 不 完全 同步 ， 一 般 用 于 时 
效 性 较 低 的 应 用 ， 例 如 每 月 报表 或 者 季度 报表 等 。 
e 混合 型 : 结合 上 面 两 种 模式 ， 将 基本 表 的 更 新 即时 传播 到 一 个 过 渡 表 Cstaging table) 
中 ， 然 后 在 适当 的 时 候 用 REFRESH 命令 将 中 间 表 的 数据 更 新 到 MQT。 创 建 MQT 的 
刷新 选项 为 REFRESH DEFERRED。 


453 duu i 

下 面 通 过 分 析 一 个 INSERT 语句 的 访问 计划 来 研究 即时 刷新 MQT 的 数据 传播 机 制 。 从 图 
5-14 的 访问 计划 中 可 以 看 到 ， 在 INSERT 操作 之 上 ， 有 一 套 复 杂 的 机 制 将 这 条 新 插入 的 数据 刷 
新 到 MQT. 


CREATE TABLE SALES BY TRANSID AS 
( SELECT cransicl, COUNT (=) 
FROM TRANSITEM 
GROUP BY transid ) 
DATA INITIALLY DEFERRED 
REFRESH IMMEDIATE; 


as item count, SUM(amount) as total 


REFRESH TABLE SALES BY TRANSIDZ 


CREATE INDEX SALES BY TID IX ON SALES BY TRANSID (transie) ; 


RUNSIVAS EONA A E ANTS 
WITH DISTRIBUTION AND DETAILED INDEXES ALL; 


EXPLAIN PLAN FOR 
INSERT INTO TRANSITEM VALUES('1004', 


22808 


200.00, '2"); 


/ 
0.00022176 


8)  TRANSITEM 
0 0048 
0 


| 1 
TABFHC: SYSIBH 


FILTER TABLE: STARS 
( 3) SALES BY TRANSID 
103.765 
ü 
| 
1 
UPDATE 
EE 
103.728 
EL 4 
1 43120 
NLJOIN — TABLE: STARS 
( 5) SALES BY TRANSID 
78.2025 
4 
f------------ +----------- X 
1 1 
BRPBY FETCH 
5) ( 39) 
25.4248 52.8321 
1 2 
| aaa ah 
1 1 4329 
INSERT IXSCAH TABLE: STARS 
(o7) ( 10) SALES BY TRANSID 
25,4048 z/.43503 
1 1 
1 10000 4329 
TBSCAN TABLE: STARS INDEX: STARS 


SALES BY TID IX 


图 5-14. MQT 即时 刷新 的 内 部 机 制 
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来 看 一 下 利用 过 波 表 的 MQT 刷 新 机 制 。 为 MQT 创 建 过 波 表 和 利用 过 波 表 刷新 MQT 的 SQL 
语句 如 下 所 示 : 
CREATE TABLE SALES BY TRANSID AS 
( SELECT transicd, COUNT(*) as item count, SUM (amount) as tortal 
FROM TRANSITEM 
CROVES) 


DATA INITIALLY DEFERRED 
REIREI EEDE ERRED 


CREATE TABLE STG SALES BY TRANSID FOR SALES BY TRANSID PROPAGATE IMMEDIATE; 


set integrity for SALES BY TRANSID materialized query immediate unchecked; 
set integrity for STG SALES BY TRANSID staging immediate unchecked; 


REFRESH TABLE SALES BY TRANSIDZ 
CREATE INDEX SALES BY TID IX ON SALES BY TRANSID(transid) ; 


RUNSTATS ON TABLE SALES BY TRANSID 
WITH DISTRIBUTION AND DETAILED INDEXES ALL; 


INSERT INTO TRANSITEM SELEC ooo% 
REFRESH TABLE SALES BY TRANSID INCREMENTAL; 


那么 这 种 刷新 的 内 部 机 制 如 何 呢 ? 如 图 5-15 所 示 ， 它 采用 一 种 折 中 的 方式 ， 对 基本 表 的 更 
狐 只 是 传播 到 过 渡 表 中 ， 此 时 不 会 对 MQT 表 做 任何 更 新 ;而 过 小 表 的 数据 则 通过 REFRESH 
命令 (例如 在 运 维 窗口 ) 刷新 到 MQT 中 。 由 于 过 波 表 的 数据 与 MQT 相 比 一 般 较 少 ， 将 基本 表 
的 更 新 即时 传播 到 过 流 表 速度 很 快 ， 因 此 ， 这 种 方式 对 基本 表 上 搬入、 更 新 和 删除 操作 影响 也 
较 小 。 


即时 传播 : 延 时 更 新 


图 5-15 ”利用 过 渡 表 的 MQT 刷新 机 制 


实际 上 ，MQT 对 基本 表 的 影响 较 小 ， 一 般 为 5%~10% 的 开销 ， 但 是 对 报表 分 析 中 复杂 奉 询 
性 能 的 提高 往往 是 几 倍 甚 至 儿 十 倍 ， 所 以 总 体 来 看 ， 是 用 小 的 投入 换 来 大 的 回报 。 


5.6.4 MQT 设计 最 佳 买 践 


MQT 一 般 用 于 OLAP 应 用 的 复杂 查询 ， 如 报表 和 分 析 应 用 。 下面 总 结 一 下 设计 MQT 的 最 
佳 实践 : 
CD 对 含有 GROUP BY 子 句 和 聚集 操作 (SUM. COUNT 和 AVG 等 ) 的 关键 查询 创建 
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MQT。 因 为 肾 集 操作 本 映 的 成 本 很 高 ， 涉 及 大 量 的 IO 操作 ， 如 果 直 接 访问 MQT， 人 性 能 会 得 到 
很 大 的 提高 。 

(2) 创建 具有 通用 性 的 MQT， 并 避免 在 WHERE 条 件 中 设置 太 多 的 局 部 谓词 ， 使 它 能 关 
更 多 的 用 户 查 询 利 用 。 例 如 ， 和 针对 下 和 面 用 于 分 析 销 售 业绩 的 各 种 报表 但 询 ， 创 建 的 MQT 在 
deptment、product 和 year mon 三 个 字段 上 进行 分 组 聚集 ， 于 是 下 面 的 这 些 租 询 均 可 用 到 这 个 


MQT. 

fri 1: 

SELECT SUM() ... FROM SALES WHERE deptment = 'A' 

GROUPES tOOuCc eden 

fri) 2: 

EBIBECIEOUM OS PROM SALES WHERE product = PAIS 

RSOUEENEOSEEIEI E eon; 

查询 3: 

SELECT SUM ..。 FROM SALES WEERE year mon = 201110 
GROUPOBY depotmenb, oe 

fri) 4: 

SELECT SUM() ... FROM SALES 


CROVPAP ee E O; 


创建 的 MoT 如下: 
CREATE TABLE M SALES as ( 
SELECT SUM() ... FROM SALES 
GROUP BY deptment, product, year mon 


(32) 针对 大 数据 量 的 MQT 表 ， 可 以 为 其 创建 合适 的 索引 ， 从 而 进一步 提高 复杂 查询 的 
性 能 。 

(4) MQT 并 不 是 越 多 越 好 ， 它 不 仪 会 占用 存储 空间 ， 而 且 会 增加 编译 时 间 。 因 此 需要 有 
针对 性 地 创建 MQT， 保 证 其 能 够 真正 融 来 性 能 上 的 提升 。 

(5) MQT 会 在 一 定 程度 上 影响 基本 表 的 插入 、 更 新 和 删除 操作 的 性 能 ， 因 此 要 权衡 利 浆 ， 
选择 合适 的 刷新 机 制 。 

(6) 可 以 利用 db2advis 工具 辅助 MQT 表 的 设计 。 

很 多 读者 可 能 过 到 过 这 样 的 情况 ,成 功 创建 了 MQT, 但 是 并 未 被 预期 使 用 ， 那 么 该 如 何 检 
查 和 诊断 呢 ? 

(1) 确保 CURRENT REFRESH AGE 注册 变量 设置 为 ANY, 这 样 DB2 才 会 考虑 用 MQT 
来 优化 查询 ， 如 下 所 示 : 


db2 SET CURRENT REFRESH AGE ANY 


(2) 确保 对 MQT 启用 了 优化 选项 ， 即 在 创建 或 者 更 改 MQT 的 语句 指定 了 ENABLE 
QUERY OPTIMIZATION 选项 ， 这 样 优化 占 才 会 考虑 此 MQT. 

(3) 分 析 用 户 查 询 并 与 MQT 的 定义 比较 ， 确 保 查 询 能 用 该 MQT 来 优化 。 

(4) 运行 RUNSTATS 收集 MQT 和 基本 表 的 统计 信息 。 由 于 DB2 优化 器 是 基于 代价 计算 
来 决定 是 否 选择 MQT， 准 确 地 统计 信息 很 重要 。 

(5) 默认 情况 下 ，DB2 只 考虑 用 系统 维护 MOT 来 优化 查询 。 如 果 创 建 的 MQT 是 用 户 维 
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护 的 ， 那 么 需要 将 注册 变量 CURRENT MAINTAINED TABLE TYPES FOR OPTIMIZATION 设 
置 为 USER， 如 下 所 示 : 


db2 SET CURRENT MAINTAINED TABLE TYPES FOR OPTIMIZATION USER 


5.7 强大 的 数据 压缩 


在 IO bound 的 数据 库 系统 中 , Hs E RE Ue. 索引 、 临时 表 每 对 象 只 需 更 少 的 IO RZ, 
而 且 绥 剖 池 中 也 能 容纳 更 多 的 数据 ， 从 而 提高 缓冲 池 命 中 率 ， 这 对 性 能 提高 是 非常 有 帮助 的 。 
除了 压 绾 数据 外 ， 也 可 以 压缩 日 六， 从 而 减少 归档 时 间 ; 还 可 以 压缩 备份 介质 ， 从 而 缩短 备份 
时 间 。 

DB2 一 直 在 压缩 技术 上 不 断 改进 。 在 V9.1 中 引入 了 行 压缩 技术 ， 随 后 在 V9.5 中 加 入 了 
ADC (Automatic Dictionary Creation) 特性 ， 在 V9.7 中 提供 了 对 XML SH Hs cT. dE 


V10.1 中 更 进一步 提出 了 自 适应 压缩 技术 ， 可 以 根据 不 同 的 压缩 样本 灵活 选择 行 压缩 或 者 页 压 
缩 技术 。 


Aa 注意 :CPU bound 的 系统 不 应 启用 压 乡 
由 于 压缩 和 解压 缩 会 带 来 一 定 的 CPU 开销 ， 所 以 在 CPU bound 的 系统 中 不 应 启用 


5.7.1. fr Hs HR RISE H dT 


行 压缩 是 针对 V9.1 以 前 已 有 的 值 压缩 技术 提出 的 。 值 压缩 是 将 表 不 同行 、 同 一 列 的 重复 
数据 只 保存 一 份 ， 其 他 地 方 仅 是 引用 而 已 。 行 压缩 则 是 以 行为 数据 压 绾 的 基本 单位 ， 在 压缩 过 
程 中 ， 行 不 会 被 拆 为 列 来 处 理 。 通 过 行 压 绽 技 术 ， 用 户 能 够 为 数据 表 建 立 一 个 表 级 别 的 数据 子 
典 ， 并 使 用 该 字典 来 压缩 整个 表 中 的 全 部 数据 。 

压缩 字典 作为 隐藏 对 象 存 储 在 数据 库 中 ， 并 且 一 般 将 它 绥 存在 内 存 中 以 便 快速 访问 。 和 字典 
不 会 占用 很 多 空间 , 即使 对 于 非常 大 的 表 , 压缩 子 典 通常 也 只 占用 大 约 100 KB 空间 。 从 图 5-16 
可 以 看 到 ， 字 和 典 包含 数 据 行 中 重复 的 日， 行 压缩 基于 字典 对 每 一 行 数据 进行 压缩 。 行 是 压缩 的 
基本 单位 ， 这 包含 两 点 : 


Potopoulos [510 — | 10000 Whitby L4N5R4 
Katsopoulos 500 | 20000 Whitby L4N5R4 


Dictionary 


图 5-16 行 压 缩 的 技术 原理 
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o 行 不 会 被 拆 为 列 来 处 理 ; 
o 不 做 跨行 处 理 ， 一 行 数据 压缩 后 还 是 完整 的 一 行 。 
G 注意 : 分 区 表 的 独立 压缩 字典 " 
表 分 区 或 DPF 的 每 个 分 区 都 有 自己 独立 的 压缩 字典 。 


1. REH 


那么 如 何 对 一 个 表 局 用 压缩 呢 ? 很 徐 单 ， 在 创建 表 的 CREATE TABLE 语句 中 使 用 
COMPRESS YES 选项 ; 也 可 以 在 ALTER TABLE 语句 中 使 用 COMPRESS YES 随时 对 现 有 表 
启用 压缩 。 例 如 ， 对 STORE SALES 表 启 用 压缩 。 


ALTER TABLE TPCD,. STORE SALES COMPRESS YES 


但 是 启用 压缩 后 还 需要 有 创建 字典 的 操作 。 在 DB2 V9.1 中 ， 表 重组 是 创建 字典 的 唯一 方 
式 ， 但 是 对 大 表 进 行 重 组 的 开销 较 大 ， 使 用 较为 不 便 。 变 通 的 办 法 是 ， 将 一 小 部 分 数据 先 寻 入 
表 中 ， 在 此 之 上 进行 表 重 组 建立 字典 ， 然 后 后 续 进 入 表 中 的 数据 就 会 被 目 动 压 缁 了 。 

但 是 ， 如 有 条 建立 字典 之 后 表 中 数据 发 生 剧 烈 变 化 ， 原 先 的 字典 就 有 可 能 不 能 很 好 地 压 纵 变 
化 之 后 的 数据 ， 这 时 可 以 使 用 带 有 重 置 字 典 选 项 (ORESETDICTIONARYO 的 表 重 组 命令 来 重新 
创建 压缩 字典 并 用 新 字典 压缩 已 有 数据 。 例 如 : 


REORG TABLE TPCD, DAILY SALES RESETDICTIONARY? 


如 果 局 用 表 压 缩 后 ， 表 中 已 有 压缩 字典 ， 重 组 操作 默认 情况 下 会 保持 字典 不 变 ， 对 数据 进 
行 重组 ， 相 当 于 使 用 KEEPDICTIONARY 选项 。 


2. 索引 压缩 


当 在 建 表 时 局 用 COMPRESS YES 选项 ， 默 认 情 况 下 ， 该 表 上 的 索引 也 上 自动 局 用 了 压缩 。 
当然 ， 也 可 以 在 创建 索引 或 者 修改 索引 时 显 式 指 定 是 否 启用 压缩 功能 ， 命 令 如 下 : 


CREATE LNDEX ., COMPRESS ur 
bap ES IDE XE COMPRESS YESp 


Aa 注 意 : ALTER INDEX 语句 


ALTER INDEX 语句 不 支持 这 样 的 更 改 : 修改 CLUSTER 属性 、 索 引 升 降序 、 修 改 
组 合 索 引 的 列 等 。 如 果 需 要 对 索引 做 这 种 修改 ， 只 能 先 删 掉 索引 ， 然 后 重建 。 


3. 自动 字典 创建 (ADC) 


在 V9.1 中 手工 创建 字典 对 DBA 来 说 不 是 特别 方便 ， 所 以 在 V9.5 中 增加 了 ADC 特性 。 
在 启用 行 压缩 后 ， 压 缩 字 典 会 在 表 中 的 数据 增加 到 一 定数 量 之 后 《默认 是 2M) 自动 创建 ， 随 
后 表 中 新 增 的 数据 克 会 基于 字典 压缩 。 上 自动 字典 的 建立 帘 化 了 行 压缩 的 使 用 ， 使 得 用 户 不 再 需 
要 手工 运行 表 重 组 操作 了 。 
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A 注意 : ADC 5 REORG 
有 些 读者 可 能 对 ADC 的 使 用 存在 误区 ,认为 有 了 ADC 特性 后 就 不 需要 手工 REORG 
来 维护 压缩 了 。 其 实 不 然 ! 建 表 时 启用 了 压缩 特性 ， 当 数据 增加 到 一 定量 后 ，ADC 能 
动 地 创建 压缩 字典 ， 并 压缩 随后 增加 的 数据 。 如 果 数 据 发 生变 化 ， 压 缩 率 下 降 时 ， 则 需 
要 用 REORG 来 重组 表 ， 建 立新 的 压缩 字典 。 


图 5-17 显示 了 自动 创建 压缩 字典 的 过 程 ; 


EMPTY New Data Added is 
TABLE Uncompressed Row Data Dictionary Build Compressed 


INSERT 
IMPORT 


一 全 


Dictionary 


Dictionary 


LOAD 
RESIST ADC Threshold 


(Compressed 
Row Data 


COMPRESS YES 


E517 ”自动 创建 字典 的 技术 原理 


(D 创建 表 时 指定 了 COMPRESS YES 选项 ， 由 于 是 空 表 ， 没 有 创建 压缩 字典 。 

EO is 

(35 随 着 更 多 数据 插入 到 表 中 ， 当 达到 阔 值 (默认 为 2M) ， 就 会 自动 触发 字典 的 创建 过 
程 。DB2 基于 已 有 的 数据 创建 了 压缩 字典 ， 并 将 压缩 字典 和 直接 追加 存储 在 表 的 数据 后 面 ， 但 是 
原 有 的 数据 并 没有 被 压缩 。 

(4) 此 后 ， 新 增 的 数据 基于 这 个 字典 而 压缩 。 

DB2 只 会 对 在 创建 字典 之 后 才 插 入 表 中 的 行进 行 压缩 。 不 会 对 创建 字典 之 前 就 已 存在 的 那 
些 行进 行 压缩， 除非 更 改 那 些 行 ， 或 者 使 用 REORG 重建 了 字典 。 

由 于 ADC 创建 的 字典 仅 基 于 很 少 的 一 部 分 数据 ， 随 着 数据 的 变化 ， 表 的 压缩 率 可 能 降低 。 
这 时 ， 可 以 使 用 带 有 重 置 字 典 的 选项 对 表 进 行 重组 。 


5.7.2 V10 新 特性 : E Iz Hs HA 


行 压缩 的 字典 是 静态 的 ， 除 非 使 用 带 有 RESETDICTIONARY 选项 进行 重组 操作 ， 和 否则 字 
典 在 创建 之 后 不 会 随 着 数据 的 变化 而 发 生变 化 。 但 是 ， 随 着 表 中 数据 的 变化 ， 使 用 静态 的 压缩 
字典 可 能 使 得 表 的 压缩 率 降 低 ; 另外 行 压缩 的 学 典 是 全 局 的 , 并 不 能 反映 数据 的 局 部 见 余 特征 ， 
例如 ， 一 张 表 的 菜 几 处 相 邻 的 看 干 条 数据 相似 度 非 香 高 ， 全 局 的 压缩 字典 难以 对 这 些 局 部 的 郊 
余数 据 达到 最 佳 的 压缩 效果 。 

针对 这 两 个 问题 ，DB2 VIO 提出 了 目 适 应 压缩 技术 ， 筷 在 原 有 行 压缩 的 基础 上 上 ， 再 县 加 了 
页 压缩 。 页 压缩 是 动态 的 ， 它 使 用 的 字典 是 局 部 的 ， 上 只 针对 其 所 在 页 的 数据 。 当 页 中 的 数据 达 
到 一 定 程度 时 ， 页 字典 会 目 动 被 建立 ， 并 且 已 有 数据 会 被 自动 压缩 ， 当 页 中 的 数据 发 生变 化 后 ， 
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压缩 率 衰减 到 一 定 程 度 时 ， 页 字典 会 自动 被 重建 。 
如 何 使 用 目 适 应 性 压缩 呢 ? 在 DB2 VIO 中 引入 了 一 个 新 关键 字 一 ADAPTIVE， 请 看 下 
列 语法 : 


.-COMPRESS NO--------------- ; 
> 一 一 一 十 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 + 一 一 
| .-ADAPTIVE-. | 
'-COMPRESS YES-4---------- +=! 
'-STATIC---' 


STATIC 关键 字 代表 原 有 的 行 压缩 方案 ，ADAPTIVE 代表 对 表 启 用 新 的 自 适 应 压缩 ， 如 果 
没有 指定 STATIC 或 者 ADAPTIVE 关键 字 时 ， 默 认 启 用 自 适 应 压缩 。 
例如 ， 在 建 表 时 局 用 目 适 应 压缩 的 语句 如 下 : 


Crearte cable cilic int, name char ll 


compress yes adaptive 


fE IR]I—4 Ja Fd Y B3 NL HAIR B Enn di ANS E. BUR EP eEETT RH. 3A EEH 
T HA ^ KARAER PA Je IBUBUAN SUUS Js XE 77 GS DUO JR UH HE HUE 
JRE, Vlt BIS BORA. AA UAE HS] AN: 先进 行 基于 页 压缩 字典 对 数据 
WAE Aa REITIT RM BAR. 25— 7 25098 E TRI AE c E 8] 20188 15 SP B Hs H8 BE Hs f 
AH i PREN, VADLHRÁOE GU HORE. vir RD A db ROBUR e 


5.7.3 数据 压缩 实践 与 探索 


由 于 用 户 数 据 的 多 样 性 ， 并 不 是 所 有 数据 都 适合 使 用 压缩 处 理 。 因 此 ， 在 使 用 压缩 以 前 ， 
在 不 改变 数据 的 情况 下 对 压缩 的 效果 进行 评估 是 非常 必要 的 , 启用 压缩 后 , 也 需要 跟踪 压缩 率 。 
也 就 是 说 ， 使 用 压缩 技术 包括 下 面 四 个 步骤 : 

CD 启用 压缩 前 ， 使 用 工具 评估 压缩 率 ; 

(20 对 具有 高 压缩 率 的 表 局 用 压缩 ， 随 后 进行 重组 ; 

(30 检 碍 压缩 后 的 效果 ， 看 实际 节省 了 多 少 存 储 空 间 : 

(4) 随 着 系统 的 运行 ， 监 控 压 缩 率 ， 必 要 时 重 置 字典 重组 表 。 

在 DB2 中 , 可 以 使 用 管理 视图 来 估计 局 用 压缩 到 底 可 以 节省 多 少 存储 空间 。 先 来 了 解 一 下 
管理 视图 的 历史 变迁 ， 如 表 5-3 Bron. 


表 5-3 压缩 率 有 关 的 管理 视图 


DB2 V9.1 没有 管理 视图 ， 使 用 命令 INSPECT ROWCOMPESTIMATE 

DB2 V9.5 ADMIN GET TAB COMPRESS INFO (第 三 个 参数 为 ESTIMATE)') 
DB2 V9.7 ADMIN GET TAB COMPRESS INFO V97 的 ESTIMATE 模式 
DB2 V10.1 SYSPROC.ADMIN GET TAB COMPRESS INFO 


DB2 V9.1 | 从 SYSCAT.TABLES 计算 
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CEK) 
DB2 V9.5 ADMIN GET TAB COMPRESS INFO 的 REPORT 模式 (第 三 个 参数 ) 
DB2 V9.7 ADMIN GET TAB COMPRESS INFO V97 的 REPORT 模式 
DB2 V10.1 SYSPROC.ADMIN GET TAB DICTIONARY INFO 


A 


人 A /一 "UD 
Aa 注意 : 执行 RUNSTATS 命令 


在 执行 这 些 压缩 座 有 关 的 管理 视图 命令 前 ,需要 运行 RUNSTATS 命令 获取 最 新 的 统 
?H$ &. 


下 面 以 DB2 V9.7 为 例 ， 探 讨 一 下 如 何 结合 管理 视图 来 对 表 TPCDS.CUSTOMER 以 及 其 上 
的 索引 进行 压缩 。 
1. 压缩 表 TPCDS.CUSTOMER 


第 一 步 , 使 用 ADMIN GET TAB COMPRESS INFO V97 的 ESTIMATE 模式 (第 3 个 参数 ) 
来 估计 CUSTOMER 这 个 表 的 压缩 率 ， 如 下 所 示 ， 得 到 的 压缩 率 为 60%。 从 输出 中 也 可 以 看 到 ， 
该 管理 视图 会 估计 XML 数据 的 压缩 率 ， 但 是 CUSTOMER 表 没 有 XML 列 ， 所 以 输出 为 0。 


SELECT substr(TABSCHEMA,1,10) TABSCHEMA, substr(TABNAME, 1, 10) TABNAME, 
COMPRESS ATTR,COMPRESS DICT SIZE,ROWS SAMPLED,PAGES SAVED PERCENT,AVG COMPRESS REC LE 
NGTH,OBJECT TYPE FROM TABLE (SYSPROC.ADMIN GET TAB COMPRESS INFO V97('TPCDS', 'CUSTOMER', 
'ESTIMATE'))" 


TABSCHEMA  TABNAME COMETE OVE ROWS SAMPLED 
PACES SAVED PEARCENT AVG COMPRESS REC LENGTH OBJECT TYPE 


MECS CUSTOMER N 37632 500000 60 89 DATA 
JS ID CUSTOMER N 0 0 0 0 XML 


2 record(s) selected. 


第 二 步 ， 使 用 ALTER TABLE…COMPRESS YES 命令 启用 压缩 ， 此 时 ， 表 中 的 数据 并 不 会 
压缩 ， 接 者 使 用 REORG 命令 对 表 进 行 重组 ， 并 运行 RUNSTATS 命令 更 新 统计 信息 ， 如 下 所 未。 

alter table tpcds.customer compress yes; 

DB20000I The SQL command completed successfully. 

reorg table tpcds.customer; 

DB20000I The SoL command completed successfully. 


runstats on table tpcds.customer and indexes all; 


DB20000I The SQL command completed successfully. 


第 三 步 ， 使 用 ADMIN GET TAB COMPRESS INFO V97 的 REPORT 模式 来 查看 实际 的 
压缩 效果 ， 得 到 的 压缩 率 为 60%， 与 表面 估计 的 一 样 。 


SELECT substr(TABSCHEMA,1,10) TABSCHEMA, substr(TABNAME, 1, 10) TABNAME, 
COMPRESS ATTR,COMPRESS DICT SIZE,ROWS SAMPLED,PAGES SAVED PERCENT,AVG COMPRESS REC LE 
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NGTA, OBJECT TYPE PROM TABLE (SYSPROC .ADMIN GET TAB COMPRESS INFO V97 ("TPCDS"; "CUSTOMER" 
'REPORT')) 


TABSCHEMA  TABNAME COMPRESS ATTR COMPRESS DICT SIAE ROWS SAMPLED 
PACES SAVED PERCENT AVG COMPRESS REC LENGTH OBJECT TYPE 


SEC, DIS CUSTOMER YX 37632 500000 60 89 DATA 
1 BCDS CUSTOMER X 0 0 0 0 XML 


2 record(s) selected. 


2. Hae TPCDS.CUSTOMER 上 的 索引 


"B—2p, GREKU, ALEME admin get index compress info SATE 511] Hs 4 Jr 
性 和 压缩 率 ， 如 下 所 示 ， 表 TPCDS. CUSTOMER 上 有 7 个 索引 ， 每 个 索引 的 压缩 率 并 不 相同 ， 
其 中 ，CC CURHDEMO、CFIRSTSHIPTODATE 和 C SALESDATE 具有 较 好 的 压缩 率 ， 分 别 
为 479. 529954 5295. 


SELECT substr (indname, 1,168) as indname, compress attr, index Compressed, 
pet pages saved, num leaf pages savec) TROM 
TABLE (sysproc. acmin get index Compress info(“", ‘TPCDS", “CUSTOMER, NULL, NULL)) AS € 


INDNAME GOMERES SE Roots SIUE COTES n S DE ED 
NUM LEAF PAGES SAVED 


S0L120728090612660  N N 0 0 
CC CURCDEMO N N 0 0 
CC_CURHDEMO N N 47 119 
E N N SIE 295 
C CURADDR N N 1 6 
C FIRSTSHIPTODATE N N 52 129 
C SALESDATE N N 52 129 


7 record(s) selected. 


比较 : COMPRESS ATTR $H INDEX COMPRESSED 含义 


COMPRESS ATTR 表示 索引 的 压缩 属性 是 否 居 用 ，INDEX COMPRESSED 表示 索引 是 否 
被 压缩 。ALTER INDEX 局 用 压缩 能 改变 前 一 个 属性 ， 而 REORG 后 才 表 示 索 引 真 正 被 压缩 了 。 


第 二 步 ， 对 这 三 个 索引 局 用 压缩 ， 然 后 执行 重组 ， 并 收集 索引 的 统计 信息 ， 如 下 所 未 ， 不 
能 重组 单个 沦 引 ， 只 能 香 组 表 上 的 所 有 索引 。 


alter index en Me na TI 
DB200001 The SQL command completed successfully. 


alter index 七 全 人 GBS cts FIRSTSHIPTODATE compress yes, 
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DB20000I The SQL command completed successfully. 


alter index ioa. SALESDATE COmpress yes; 
DB20000I The SQL command completed successfully. 


reorg index ios C CURAIDEMO; 
SQOLO270N Function not supported (Reason code = "89"). 3SOQLSTATE-42997 


reorg indexes all for table tpcds.customer; 
DB200001 The REORG command completed successfully. 


runstats on table tpcds.customer for indexes all; 
15820900 T The RUNSTATS command completed successfully. 


第 三 步 ， 使 用 admin get index compress info 查看 索引 的 压缩 属性 和 压缩 紊 ， 如 下 所 示 ， 
得 到 的 实际 压缩 率 与 估计 的 差不多 ，CC CURHDEMO, CFIRSTSHIPTODATE 和 
C SALESDATE 分 别 为 49%、52% 和 52%. 


SELECT substr (indname, 1,18) as indname, compress attr, index Compressed, 
pert pages saved, num leaf pages savec) FROM 


TABLE (sysproc. acmin get index Compress beo 7 "TPCDS", "CUSTOMER", NULL, NULL)) AS € 


INDNAME CONSTI S TEND OME eSI S dcn D CE ED 
NUM _ LEAF PAGES SAVED 


SQL120728090612660 N N 0 0 
CC_CURCDEMO N N 0 0 
CC_CURHDEMO x Y 49 109 
GE N N o 295 
C CURADDR N N 1 6 
C FIRSTSHIPTODATE Y Y 52 i12 
C SALESDATE n y 52 137 


7 record(s) selected. 


5.8 £z 


数据 库 设 计时 需要 特别 考虑 性 能 ， 一 旦 系统 上 线 ， 后 期 的 调整 往往 代价 非常 大 ， 因 此 在 一 
开始 束 需 要 做 好 设计 规划 。 为 了 处 理 TB 级 的 数据 ， 本 章 首 先 从 方法 学 谈 起 ， 介 绍 了 高 级 设计 
技术 包括 数据 库 分 区 、 表 分 区 、MDC、MQT 和 压缩 技术 的 基本 概念 。 随 后 ， 深 入 地 剖析 了 一 
坚 高 级 技术 的 内 厌 以 及 如 何在 实践 中 灵活 运用 它们 。 相 信 读 者 真正 掌握 后 ， 一 定 可 以 设计 出 一 
六 高 性 能 的 数据 库 系 统 。 
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系统 


数据 库 监控 并 不 能 带 来 直接 的 业务 效益 ,在 系统 选 型 的 时 候 很 容易 被 忽略 ,但 是 对 于 DBA 


监 d 


来 说 ， 缺 少 监 控 功 能 ， 就 像 缺 少 探照灯 的 行人 在 漆黑 的 夜里 穿行 在 复杂 的 迷宫 中 ， 是 不 可 能 找 
到 出 路 的 。 

类 似 的 ， 当 数据 库 系 统 的 性 能 下 降 时 ， 借 助 监控 信息 ， 可 以 根据 数据 库 使 用 模式 预计 硬件 
要 求 ， 也 可 以 分 析 各 个 应 用 程序 或 SQL 语句 的 性 能 ， 跟 踩 索引 和 表 的 使 用 情况 等 来 青 找 原因 。 
本 章 首先 介绍 了 系统 监控 和 DB2 数据 库 监 控 的 工具 ， 随 后 介绍 了 关键 性 能 指标 , 最 后 读者 可 以 
在 自己 的 运 维 工作 中 灵活 运用 这 些 知 识 监控 和 诊断 音 见 的 性 能 瓶颈 。 
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6.1 由 一 则 新 闻 想 到 的 


最 近 看 到 一 则 新 闻 ，2012 年 3 月 12 日 16 时 许 , KHER, FILARE EF A Xa 
妃 人 砍 看 儿 名 男子 。 不 料 神 兵 天 降 ， 民 警 突然 赶 来 并 对 犯罪 嫌疑 人 进行 了 围捕 ， 当 场 抓获 涉案 人 
员 19 名 ， 随 后 还 抓获 网 上 逃犯 名 。 

你 一 定 会 感到 奇怪 ， 人 民警 察 什 么 时 候 变 得 这 么 神奇 了 ， 接 厦 往 下 看 ， 你 就 不 会 感觉 奇怪 
了 ， 原 来 长 沙市 通过 天 网 工程 在 全 市 安装 了 大 量 的 监控 摄像 涉 ， 所 以 可 以 及 时 了 解 全 市 所 发 生 
的 突 发 事件 ， 从 而 及 时 出 警 ， 将 和 恶性 事件 消灭 在 初始 阶段 。 你 可 能 又 会 问 ， 这 么 多 监控 会 不 会 
有 侵犯 隐私 的 问题 ， 这 个 就 需要 严格 的 法 律 法 规 来 避免 …… 

打住 ， 这 个 和 DB2 的 性 能 优化 有 什么 关系 ? DB2 的 运行 也 需要 DBA 通过 监控 ， 尽 早 地 
发 现 问 题 ， 像 长 沙市 民警 一 样 ， 将 问题 消灭 在 初始 阶段 ， 这 样 才 能 保证 系统 良好 的 运行 。 那 是 
不 是 有 了 监控 手段 , 束 能 达到 DB2 民 好 运行 的 目的 呢 ? 正 像 没 有 法 律 法 规 保证 的 摄像 头 可 能 会 
侵犯 隐私 一 样 ， 不 合理 运用 监控 来 解决 问题 ， 很 有 可 能 劳 而 无 功 ， 消 耗 了 大 量 的 系统 资源 ， 但 
是 没有 监控 到 解决 问题 所 需要 的 信息 。 

那么 如 何 才 能 合理 运用 监控 呢 ? 以 招商 引资 为 例 ， 一 个 地 方 所 能 吸引 投资 的 最 大 能 力 是 由 
当地 的 资源 所 限制 的 ， 对 于 DB2 来 说 ， 其 最 大 的 处 理 能 力 是 由 其 硬件 资源 决定 的 ， 无 论 如 何 优 
化 ， 也 不 可 能 超出 硬件 资源 的 处 理 能 力 ， 所 以 必须 首先 保证 硬件 资源 能 够 满足 业务 对 处 理 能 
的 需要 。 

有 了 便 件 资源 的 保证 ， 还 需要 优化 招商 引资 的 软环境 ， 才 能 吸引 更 多 的 资金 ， 对 于 DB2 
来 说 ， 操 作 系 统 的 优化 就 像 招 商 引 资 的 外 部 环境 ， 只 有 首先 优化 好 操作 系统 ，DB2 才能 提供 更 
强 的 处 理 能 

有 了 以 上 条 件 ， 还 必须 对 企业 的 工人 进行 技能 的 培训 ， 才 能 最 终生 产 出 合格 的 产品 ， 从 而 
产生 实际 的 效益 ， 而 对 于 DB2 而 言 ， 也 就 是 必须 优化 应 用 ， 调 优 访 问 数 据 库 的 SQL 语句 。 

从 以 上 可 以 总 结 出 数据 库 性 能 调 优 的 一 般 原 则 是 便 件 资源 、 操 作 系 统 、 数 据 库 系 统 以 及 访 
问 数据 库 的 应 用 。 所 以 对 于 监控 来 说 ， 在 便 件 资源 足够 的 基础 上 上 ， 通 过 监控 ， 发 现 或 排除 操作 
系统 的 问题 ， 然 后 分 析 数 据 库 系 统 的 问题 ， 最 后 解决 数据 库 应 用 的 问题 ， 即 调 优 访问 数据 库 的 
SQL 语句 。 

便 件 资源 的 优化 ， 在 本 书 第 3 草 的 物理 设计 部 分 已 有 详细 的 介绍 ， 接 下 来 本 章 重 点 讲述 系 
统 监控 的 方法 和 DB2 数据 库 监 控 的 方法 。 


6.2 ” 探 作 系统 监控 


本 节 讨论 综合 运用 DB2 和 操作 系统 的 监控 工具 进行 CPU、LIO 和 内 存 监 控 的 方法 。 当 判断 
系统 是 否 出 现 CPU. UO 或 内 存 瓶颈 时 ， 需 要 利用 如 表 6-1 列 出 的 常用 工具 得 到 系统 状态 数据 
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表 6-1 操作 系统 监控 的 常用 命令 


命令 操作 系统 描述 


CPU 监控 top; vmstat; sar-u; sar—q LINUX/UNIX 检查 CPU 状态 


AIX 
LO 监控 10stat; sar-d;  sar-u; sar-b LINUX/UNIX 检查 操作 系统 的 VO 状态 


内 存 监控 LINUX/UNIX. | 检查 操作 系统 的 内 存 利用 情况 


网 络 监控 netstat; ping LINUX/UNIX 检查 操作 系统 的 网 络 状 态 
WINDOWS 


进程 命令 查看 操作 系统 的 进程 相关 信息 
| deof, ipcs: df; dd; nmon 查看 进程 打开 文件 信息 、 操 作 
AIX 系统 信号 、 存 储 等 
下 面 束 重要 的 常用 工具 进行 分 别 曾 述 。 
6.2.1 CPU 监控 
要 重点 关注 CPU 利用 率 、 系 统 CPU 时 间 (CPU 运行 在 内 核 态 的 时 间 ) 和 用 户 CPU 时 间 


(CPU 运行 在 用 户 态 的 时 间 ) 。 在 Unix 系统 中 ， 利 用 sar 命令 ， 可 以 看 到 每 个 CPU 的 利用 率 。 
下 面 是 sar 命令 的 一 个 典型 输出 : 


AIX nutmeg 2 599 12 20] 6100 06/4 T0 


System configuration: lepus4 


To uo oÑ $usr $sys $wlo $idle Iioc 


TS sd 0 0 0 100 0.30 
1 1 1 1 98 0.69 
2 2 il 0 96 0.69 
3 O 0 0 100 gas 
一 1 1 0 98 Ju 
AS as SSO 0 0 0 100 0.31 
1 0 0 0 100 0-69 
2 0 0 0 100 Om 
E 0 O 0 100 0.31 
= 0 0 0 IOO 204 
Disc Q 0 0 0 100 O Sil 
1 0 0 0 了 QU 0-69 
2 0 0 0 100 O- 70 
E 0 0 0 100 omon 
z 0 O 0 100 2.01 
es ES O 0 0 0 100 0.531 
1 0 0 0 100 0-69 
2 0 0 0 100 0-69 
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3 0 0 0 100 0-31 
z 0 0 0 100 2 00 
Average 0 0 0 0 100 0.531 
1 0 0 0 99 0.69 
2 1 0 0 99 0.70 
3 0 0 0 100 0.31 
= 0 0 0 99 2.01 


从 这 个 输出 可 以 看 到 每 个 CPU 的 利用 率 Coousr 18 H] P CPU, %sys 指 系统 CPU) 情况 和 总 
的 平均 利用 率 〈 最 后 的 Average 栏 ) 。 

通过 vmstat， 可 以 看 到 每 个 线程 使 用 的 用 户 CPU Cus 列 ) 、 系 统 CPU (sy 列 ) ~ CPU F 
内 Cid 列 ) 和 CPU 等 每 (wa 列 〉 时间 的 比例 : 


vmstat 1 6 
System configuration: lcpu-4 mem-15808MB 


kthr memory page faults cpu 

r b avm fre re pi po fre er MTS Sy CS us sy id wa 
1 1 110996 763741 0 0 0 0 0 0 231 96 91 0 0 99 Q 
© 0 111002 763734 0 0 0 0 0 0 332 2365 179 0O 1 99 Q 
© 0 111002 763734 0 0 0 0 0 0 3350 22055. 139 0 5 93 1 
© 0 111002 763734 0 0 0 0 0 © 310 2212 153 0O 0 99 Q 
1 © 111002 763734 0 0 0 0 0 © 314 2259 173 00 99 Q 
© 0 111002 763734 0 0 0 0 0 © 321 2261 177 0 1 99 Q 


当 CPU WAH CHIP CPU 加 系统 CPU) 长 时 间 大 于 95%, 就 可 以 认为 系统 出 现 了 CPU 
M, mi AR A HAAA AE RIE FAAN o 

在 AIX 系统 上 ， 输 入 topas 命令 ， 可 以 看 到 总 的 CPU 利用 率 情 况 。 进 入 topas 界面 后 ， 输 
入 两 个 “c” 可 以 看 到 每 个 CPU 状态 ， 如 下 所 示 : 


Topas Monitor for Nost: maradona EVENTS/QUEUES PILE A TTY 
Sat Dee 17 20325:4249 2011 Interval: 2 


CPU User% Kern% Wait% Idle% Reads 0 Rawin 0 

2 0.3 0.5 ORO 99.1 Writes 2 Ttyout 927 

0 0 .3 oms 0.0 99,2 Forks 0 Igets 0 

4 0.1 0.1 Q0. 99.7 Execs 0 Namei 1 

6 0.0 0.1 0.0 99,9 Runqueue qo ED pools 0 

5 0.0 0.0 0.0 99,9 Waitqueue 0.0 

I 0.0 0.0 0-0 100,0 MEMORY 

3 0.0 0.1 0.0 99.9 PAGING Real,MB 31872 
Faults 0 3% Comp 37 

Network KBPS I=-Pack are KB >1Nn KB=Out Steals 0 3% Noncomp 29 

Total juu Sie 0 2D S Tell PgspIn 0 $ Client 29 

PgspOut 0 
Disk Busy$ KBPS TPS KB-Reac KB=-Writ Pagern 0 PAGING SPACE 
Total 0.0 0.0 0.0 ©. 0 O 0 PageOut 0 Size,MB 20480 
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FileSystem KBPS TBES KB-=Read ECT $ Free 99 
Total ORRO 0.0 ORO ORRO 

Name PID CPUS PgSp Owner CLiY2 0 WPAR Total 0 
topas 10616944 Ol zoo eA SerV3 0 Press: "h"-help 
dtgreet 33542804 U .0 1.3 FOOT GE qus 0 “加 “= 一 GUI 


从 上 面 的 User% 和 Kern% 列 可 以 分 别 看 到 用 户 和 系统 CPU 利用 率 。 

一 般 情 况 下 ， 数 据 库 系 统 是 受 VO 而 不 是 CPU 处 理 能 力 限制 的 ( 即 一 般 为 1O Bound. ifj 
不 是 CPU Bound) ， 所 以 CPU PH GB. L4 CPU 利用 率 长 时 间 大 于 95%， 就 可 以 
认为 系统 出 现 了 CPU 瓶颈 。 此 外 ， 如 果 发 现 CPU 利用 率 比 正常 情况 下 相同 时 段 要 高 很 多 〈 比 
如 平时 30%， 现 在 S50% 以 上 ) ， 用 户 也 要 通过 进一步 分 析 找 出 变化 的 原因 。 


6.2.2 |/O 监控 
对 于 DB2 来 说 ， 最 慢 、 最 花费 时 间 的 操作 就 是 磁盘 IO， 其 在 整个 系统 中 扮演 着 重要 的 角 


色 。 当 整个 系统 的 磁盘 带宽 不 够 ， 或 者 LO 请 求 集中 在 单一 磁盘 上 ， 就 容易 产生 磁盘 UO 瓶颈 。 
利用 下 面 的 sar 命令 可 以 得 到 UO 状态 报告 (每 1 秒 采样 1 次 ， 连 续 采 样 2 次 ) 。 


= sar =@ 1 2 


AIX brave 1 6 0002568FD600 3E HII EE 


System configuration: lcpu-4 drives-3 mode-Capped 


183332349 device $busy avque rtw/s Kbs/s  avwait  avserv 
1335350 hdisk0 q O- 0 113 11040 日 -2 2 
hdiski 100 10.8 247 10928 3375 EL 
hdisk2 100 22 20/5 8256 Gs 14.3 
js hdisk0 78 ©. 0 7193 11200 opp 2 o2 
hdiski 74 0.1 864 P Qus C0, 
hdisk2 95 20 305 8648 4.9 $n 
Average hdisk0 T 0-0 784 11120 Dis dE 2 a2 
hdisk1 87 55 555 11632 16.9 Tadh 
hdisk2 97 Zod 254 8452 6.8 11,6 


从 上 面 示例 输出 中 的 %busy 列 可 以 得 到 每 个 磁盘 使 用 率 ， 从 avwait 列 可 以 得 到 平均 磁盘 等 
竺 次数。 如 果 磁 盘 的 使 用 率 超 过 80%《〈 如 上 面 监视 结果 中 的 磁盘 hdiskl 和 hdisk2 ) ， 或 者 出 现 
大 量 的 磁盘 等 待 ， 就 说 明 存 在 厂 盘 瓶颈 。 这 需要 通过 重新 分 布 表 ， 改 变 访问 计划 或 者 增加 磁盘 
AH BRL o 

利用 iostat 也 可 以 看 到 磁盘 的 忙 困 状态 ， 其 中 %tm act. 指示 物理 磁盘 活动 所 占 总 时 间 的 百 
分 比 (磁盘 的 带宽 利用 率 ) ， 当 利用 率 超 过 70% 时 ， 进 程 将 等 待 的 时 间 会 比 完成 WO 所 必需 的 
时 间 更 长 ， 这 时 就 可 能 存在 磁盘 瓶颈 ， 下 面 的 监视 结果 显示 磁盘 的 利用 率 较 低 ， 所 以 当前 系统 
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APA E OR TR SCC JS 105] 28 20 1 表示 每 秒 种 显示 一 次 结 来 ): 


s soe i 


System configuration: lcpu-4 disk-4 


蕊 电光 8 ELN TOUT envie z user $ SyS $ idle $ lowait 
0.0 392-0 m 51S 88 .3 ERE 

DHISIKE $ tm act Kbps TPS Ko reac! ë Ko wrtn 

hdisk1 ors 19.5 1.4 53437739 21482563 

hdisk0 0.7 29.7 833530 93086751 21482563 

hdisk4 qum 218a 2 6.2 238584732 832883320 

hdisk3 2al 294.3 8.0 300653060 68328863320 

使 用 -d 选项 ， 可 以 奏 看 茶 个 具体 磁盘 的 状况 : 

uo iostat =d hdiski 1 

System configuration: lcpu=4 disk=5 

Dic desig $ tm act Kbps tps Ko reac) ë Ko wren 

hdisk1 0.5 19.4 1.4 53437743 21490480 

hdisk1 SmO 78-0 2306 3633 3564 

hdisk1 Quos 0.0 0-0 0 0 

hdisk1 0.0 ©- 0 O- 0 0 0 

hdiskl ORRO 0.0 ORO 0 0 

hdisk1 0.0 0.0 ©. 0 0 0 


6.2.3 内存 监控 


内 存 作 为 CPU 和 磁盘 之 间 的 桥梁 ， 对 于 DB2 的 性 能 起 着 至 关 重 要 的 影响 ， 合 理 地 配置 内 
存 参数 ， 能 够 有 效 地 降低 磁盘 IO， 减 少 锁 升 级 等 ， 从 而 极 大 提高 系统 性 能 ， 但 是 如 采 内 存 参 
数 设 置 不 合理 ， 导 致 内 存 交 换 发 生 ， 反 而 会 降低 系统 的 整体 性 能 。 

在 Windows 系统 中 使 用 任务 管理 器 ,可 以 显示 每 个 进程 的 内 存 使 用 情况 .而 在 Unix 或 Linux 
系统 中 可 以 使 用 下 面 的 ps 命令 得 到 每 个 进程 的 内 存 使 用 情况 : 


p ps ov | nead -n 1; ps 本 了 | egrep =v "ROS | sort FGO =7 =n >r 
PID rr ŠTAT TIME PGIN SIZE RSS LIM TSIZ TRS $CPU $MEM COMMAND 

15256 = À 6415 755 2572 2888 xz ā 2350 3516 0.9 0.0 /usr/lipp/ 
22 152 = À 0:08 261 1960 1980 32768 465 20 0-0 0.0 dtum 
14654 = À 0:00 324 1952 1932 XX 198 0 0-0 0.0 /usr/sbin 
20700 = À 0307 271 1868 1896 32768 95 28 0-0 0-0 Asta eb o, 
20444 = À 0:03 205 1736 1824 32768 551 68 0.0 0.0 drfile 
1 7602 = À 0:00 274 948 1644 32768 817 696 0.0 0.0 sencmails 
1 3218 = A 0:00 74 1620 1620 XX 116 0 0.0 0.0 /usr/sbin 


在 AIX 系统 中 ， 可 以 使 用 svmon -G 命令 ， 从 输出 结果 中 的 size 列 和 virtual 714) 31] AE ZR 
统 物理 内 存 和 在 进程 虚拟 空间 中 分 配 的 内 存 ， 从 而 看 出 是 个 存在 物理 内 存 不 足 的 情况 。 


#svmon -G 


size inuse free pin yirctual 
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memory 8159232 5706251 25226013 1756809 5584319 
pg space 5242880 1689535 

work pers Glnt other 
PLn 1449315 0 0 307494 
in use 4388042 0 1318209 
PageSize PoolSize inuse pgsp PIN yirtual 
S 4 KB = 2205803 430415 400313 1206031 
m 64 KB = 218778 78695 84781 273643 


用 下 面 的 vmstat ME, SUARA EERI S ANE: 


= ymsrtat 1 4 


System Configuration: lcpu=4 mem=40 96MB 

REMn rE memory page las cpu 

r b avm fre re pi po EE SS ey in Sy ee us sy id wa 
1 2 1356583 127 0 4 0 345 2223 605 30 40 29 í 

2 7 136587 118 0 2 0 32 3451 526 20 37 10 33 
1 © 1365687 157 0 3 67 0 678 0 J34 J504 59560 25 32 20 23 
3 8 136587 111 0 5 0 329 3341 511 19 26 35 20 


fre 列表 示 空 用 的 物理 内 存 页 面 数 ， 而 avm 列表 示 系 统 工 作 所 需 的 页 和 面 数 。 如 采 系 统 工作 
所 需要 的 超出 物理 内 存 了 驶 会 发 生 换 页 。 从 上 面 的 输出 可 以 看 出 ， 系 统 存 在 很 多 的 页 换 出 〈page 
out, fE po 列 ) , VO 等 竺 时间 Cwa) 也 很 长 ， 空 闲 的 内 存 页 〈fre 列 ) 却 很 少 。 这 都 说 明 系 统 
存在 物理 内 存 不 中 的 情况 。 

利用 下 面 的 sar 命令 ， 可 以 从 fault 列 看 出 是 否 出 现 了 大 量 的 页 面 错 误 (page fault， 指 进程 
访问 的 页 面 不 在 内 存 中 ， 需 要 从 磁盘 读 入 ) o WR page fault 过 多 ， 可 能 需要 增加 用 于 文件 组 
存 的 内 存 或 增加 系统 的 物理 内 存 。 


= ear -r 1 5 


System Configuration: lcpu=4 mem=40 96MB 


06:18:05 slots cycle/s fault/s odio/s 
06:18:06 1048052 ORRO 3O To 25 0.00 
06:18:07 1048052 0521010. 112,97 0:010. 
06218:08 1048052 ORRO 45,00 79.21 
06:18:09 1048052 01241010. 216.00 0.00 
06:18:10 1048052 0,591910. 018, U 0U 


Average 1048052 0 T9 16 


db2mtrk 工具 也 可 以 被 用 来 得 看 内 存 使 用 状态 。 使 用 下 面 的 命令 可 以 查看 数据 库 中 各 种 挫 
包括 缓冲 池 的 使 用 状态 : 


| dtozsnstladb2 ~] sdi2nmbrk du 
Tracking Memory oms 2011/01/02 art 160546558 


Memory for database: FLIGHTDB 
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Backup/Restore/Util Heap is of size 196608 bytes 

Package Cache is of size 7929856 bytes 

Other Memory is of size 196608 bytes 

Catalog Cache Heap is of size 917504 bytes 

Buffer Pool Heap (1) is of size 330498048 bytes 

Buffer Pool Heap (System 32k buffer pool) is of size 655360 bytes 
System 16k buffer pool) is of size 393216 bytes 
System 8k buffer pool) is of size 262144 bytes 

Buffer Pool Heap (System 4k buffer pool) is of size 196608 bytes 

Shared Sort Heap is of size 2602144 bytes 

Lock Manager Heap is of size 28442624 bytes 

Database Heap is of size 39845888 bytes 

Application Heap (60) is of size 65536 bytes 


Buffer Pool Heap 


( 
( 
Buffer Pool Heap ( 
( 


Application Heap (59) is of size 65536 bytes 
Application Heap (58) is of size 65536 bytes 
Application Heap (57) is of size 65536 bytes 
Application Heap (56) is of size 65536 bytes 
Application Heap (55) is of size 196608 bytes 
Application Heap (54) is of size 65536 bytes 
Application Heap (53) is of size 65536 bytes 
Application Heap (52) is of size 65536 bytes 
( 


Application Heap (51) is of size 131072 bytes 
Applications Shared Heap is of size 1966080 bytes 


Total: 412614656 bytes 


6.2.4 网 络 监 控 


网 络 问题 的 调整 非 第 困难 ， 因 为 有 太 多 的 变化 因素 相互 有 影响， 往往 只 有 调整 了 系统 中 其 他 
的 方面 乙 后 发 现 仍然 存在 性 能 问题 ， 才 会 注意 到 是 网 络 的 性 能 造成 的 瓶颈 。 可 以 通过 netstat —s 


命令 来 帮助 诊断 问题 : 


= MeTstat -9 


23057 active connections openings 
743 passive connection openings 
1119 failed connection attempts 
914 connection resets received 
32 connections established 
1153134 segments received 
928463 segments send out 
21456 segments retransmited 
0 bad segments received. 
2115 resets sent 
UIDES 
53 invalid SYN cookies received 
T resets receiye for emoryoniec SYN RECYVY SOOO S 
6579 TCP sockets finished time wait in fast timer 
29 packets rejects in established connections because of timestamp 
15053 delayed acks sent 
5 delayed acks further delayed because of locked socket 


Quick ack mode was activated 7395 times 
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16189 packets directly queued to recvmsg prequeue. 

430150 bytes directly in process context from backlog 
9384212 bytes directly received in process context from prequeue 
799853 packet headers predicted 

6902 packets header predicted and directly queued to user 
50683 acknowledgments not containing data payload received 
24955 predicted acknowledgments 

12 times recovered from packet loss due to fast retransmit 
204 times recovered from packet loss by selective acknowledgements 
11 congestion windows recovered without slow start by DSACK 
2569 congestion windows recovered without slow start after partial ack 
TCPLostRetransmit: 4 

20 timeouts after reno fast retransmit 

30 timeouts after SACK recovery 

218 timeouts in loss state 

248 fast retransmits 

45 forward retransmits 

844 retransmits in slow start 

8542 other TCP timeouts 

8 classic Reno fast retransmits failed 

135 SACK retransmits failed 

72351 DSACKS sent for ole! packets 

496 DSACKs sent for out of order packets 

1816 DSACKs received 

526 connections reset due to unexpected data 

207 connections reset due to early user close 

1680 connections aborted due to timeout 

TCBPSACKDIiSCarcl: 1 

TCPDSACKIgnoredNoUndo: 280 

WeepsalelsS ese 

TCPSackMerged: 31 

TCPSacCckShiferalloback:s: 1689 

TCPRcvCoalesce: 160837 


如 果 (segments retransmitted/segments send out) 的 结果 大 于 10%， 则 极 有 可 能 遇 到 了 严重 
的 吞吐 问题 ， 几 乎 可 以 肯定 要 增加 更 多 的 带宽 、 或 者 减少 进出 网 络 的 流量 大 小 。 


6.3 效 据 库 监 控 


DB2 提供 了 多 种 多 样 的 监控 手段 ， 主 要 包括 快照 监视 器 《Snapshot Monitor) 、 事 件 监 视 喜 
(Event Monitor) . ls wK (Monitoring Table Functions) 、 管 理 视图 (Administrative 
Views) . db2pd 以 及 db2top 等 。 工 欲 善 其 事 必 先 利 其 器 ，DBA 需要 根据 具体 的 需求 选用 合适 
的 工具 ， 做 到 物 尽 其 用 。 


6.3.1 快照 监视 器 


DB2 中 最 常用 也 最 直接 的 监控 工具 束 古 快照 监视 如 。 快照 监 视 右 可 以 让 你 获得 当前 时 间 扣 
的 数据 库 状态 信息 。 一般 来 说 ,快照 监视 右 的 开销 不 大 (大 约 占 用 3%~6% 的 系统 开销 )。 如 来 
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每 阳 一 定时 间 间 阳 获 取 快 照 ， 那 么 快照 在 观察 和 预测 潜在 问题 方面 也 很 有 用 。 


要 想 获 取 快 照 信息 ,必须 先 打 开 快 照 开 天 。, 快照 信息 包括 BUFFERPOOL (Zit), LOCK 


CB) ~ SORT (排序 ) ~ STATEMENT (SQL fJ) ~ TABLE (CR) 、TIMESTAMP (HEJER) 
和 UOW (事务 ) 等 ,它们 需要 用 各 目的 开关 打开 。 表 6-2 列 出 了 快照 开关 名 称 、 其 对 应 的 数据 
库 管理 器 (OBM) 参数 和 对 应 的 快照 信息 。 


表 6-2 快照 开关 及 其 对 应 的 DBM 参数 和 快照 信息 


快照 开关 DBM 参数 对 应 的 快照 信息 


BUFFERPOOL | DFT MON BUFPOOL 收集 缓冲 池 读 写 次 数 和 读 写 所 花费 的 总 时 间 等 信息 
TIMESTAMP DFT MON TIMESTAMP | 收集 各 种 时 间 相 关 信 息 


SORT DFT MON SORT 收集 排序 所 使 用 的 堆 大 小 等 信息 
STATEMENT DFT MON STMT 收集 SQL 语句 开始 /结束 时 间 ，SQL 语句 文本 等 信息 


em 4E 


TABLE DFT MON TABLE 收集 从 表 中 的 读 写 行 数 等 信息 
LOCK DFT MON LOCK 收集 友 生 的 锁 等 竺 次 数 、 死 锁 次 数 等 信息 


UOW DFT MON UOW 收集 事务 的 开始 /结束 时 间 ， 完 成 状态 等 信息 


如 条 想 在 每 次 重新 连接 数据 库 时 就 目 动 开始 收集 茶 项 快照 信息 ， 那 么 需要 将 对 应 的 DBM 


参数 设 为 ON。 例如 下 面 的 命令 可 以 将 缓冲 池 快 照 信息 对 应 的 DBM 参数 DFT MON BUFPOOL 
设 为 ON。 这 样 以 后 每 次 重新 连接 时 ， 绥 冲 池 快 照 信息 开关 都 是 打开 的 。 


Te exea eee eo CEDE GISMPIDIS, 
db2 update dbm cfg using DFT MON BUFPOOL ON 


db2 terminate 


也 可 以 在 每 次 连接 数据 库 时 ， 使 用 update monitor switches 显 式 打开 或 关闭 快照 开关 。 命 令 


的 语法 如 下 : 


db2 update monitor switches using [bufferpool | lock | sort | statement | uow | table 


mms a 


例如 ， 下 面 的 命令 将 锁 快 照 信息 开关 打开 。 此 后 锁 快 照 信息 将 被 持续 收集 ， 直 到 数据 库 连 


接 结 束 并 执行 db2 terminate， 或 者 使 用 update monitor switches 命令 关闭 快照 开关 。 
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db2 update monitor switches using lock on 
你 可 以 使 用 下 面 的 命令 得 询 各 个 快照 开关 是 人 否 被 打开 了 : 
=> db2 get monitor switches 

Monitor Recording Switches 


Switch list for dbo partition number Q0 


Buffer Pool Activity Information (BUFFERPOOL) = OFF 

Lock Information (LOCK) = OFF 

Sorting Information (SORT) = OFF 

SQL Statement Information (STATEMENT) = OFF 

Table Activity Information (TABLE) — ON 2012-11-07 15:33:10.9888675 
Take Timestamp Information (TIMESTAMP) = ON 2012-11-07 15:20:45.884026 
Unit GE Work Informacion (UOW) = OFF 
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监视 器 开关 打开 后 ， 可 以 使 用 get snapshot 命令 得 到 快照 信息 ， 基 本 语法 为 (dbname X 
数据 库 名 ) : 


db2 get snapshot for [bufferpools | locks | tables | dynamic sql | applications tablespaces 
| database | all] on db «dbname» 


获取 的 快照 信息 按照 元 素 类 型 分 为 以 下 种 类 ， 如 表 6-3 Bron. 


表 6-3 快照 信息 的 元 素 类 型 
计数 器 计算 活动 的 发 生 次 数 。 在 监视 期 间 ， 计 数 絮 会 日 动 增长 ， 通 常 计 数 如 元 素 可 以 复位 
指示 茶 个 项 的 当前 值 。 根 据 数 据 库 活动 的 不 同 ， 标 尺 值 会 增加 或 减 小 例如 ， 挂 起 的 
锁定 数 ) 。 标 尺 元 素 不 能 复位 
水 位 标记 指示 从 开始 监视 以 来 元 聚 押 达到 的 极限 值 〈 最 大 或 最 小 值 )”。 水 位 标记 元 条 不 能 复位 
提供 参考 类 型 的 监视 活动 详细 信息 。 这 可 以 包括 诸如 分 区 名 称 、 别 名 和 和 路径 详细 信息 


标尺 


BE 这 类 的 项 。 信 息 元 素 不 能 复位 

nago | 通过 提供 自 1970 年 1 月 1 日 后 经 历 的 秒 数 和 微 秒 数 ， 以 指示 发 生 的 日 期 和 时 间 。 时 
间 稚 记 元 素 不 能 复位 

时 间 返回 执行 活动 所 耗 用 的 秒 数 和 微 秒 数 ， 某 些 时 间 元 素 可 以 复位 


例如 ， 可 以 使 用 下 面 的 命令 得 到 数据 库 FLIGHTDB 上 SQL 语句 的 快照 信息 ， 从 中 可 以 看 
出 每 条 SQL 语句 的 执行 次 数 、 总 的 执行 时 间 等 信息 : 


=> db2 get snapshot for dynamic sql on FLIGHTDB 
Dynamic SQL Snapshot Result 


Database name 


IE OE dS IE DIS) 


Database path 


F:NDB2NNODEOO00NSQLOO001N € [信息 ] 


Number of executions = 79551 ERITA% I ÁA] 
Number of compilations = 

Worse Teweeqg escriben im (mS, = 29 七 [水 位 标记 ] 
Best preparation time (ms) = 29 
Internal rows deleted = 0 €R] 
Internal rows inserted = 0 

Rows read = 10000 
Internal rows updated = 0 

Rows written = 0 

Statement sorts = 0 

Statement sort overflows = 0 

Total sort time = 0 

Buffer pool data logical reads = 51 

Buffer pool data physical reads = 0 

Buffer pool temporary data logical reads = 0 
Buffer pool temporary data physical reads = 0 
Buffer pool index logical reads = 7/9551 
Buffer pool index physical reads = 0 

Buffer pool temporary index logical reads = 0 
Buffer pool temporary index physical reads = 0 
Buffer pool xda logical reads = 0 


209 


DB2 设计 、 管 理 与 性 能 优化 艺术 


Buffer pool xda physical reads = 0 
Buffer pool temporary xda logical reads = 0 

Buffer pool temporary xda physical reads = 0 

Total execution time (sec.microsec)= 5.694087 志和 总 的 执行 时 间 
Total user cpu time (sec.microsec) = 3.328125 

Total system cpu time (sec.microsec)= 0.234375 


Statement text = SELECT COUNT (*) FROM HOLDINGQUEUE WHERE QUEUE = ? FOR READ ONLY 


使 用 下 面 的 命令 , 可 以 得 到 数据 库 FLIGHTDB 的 数据 库 快 照 信息 ， 从 中 可 以 看 出 数据 库 的 
基本 状态 ， 包 括 锁 、 绥 冲 池 和 排序 等 : 


=> db2 get snapshot for database on FLIGHTDB 


Database Snapshot 


Database name = FLIGHTDB 

Locks held currently = 3990 

Lock waits = 28573 

Time database waited on locks (ms) = 225179766 

Lock list memory in use (Bytes) = 491264 

Deadlocks detected = 1311 

Lock escalations = 0 锁 相 关 信 息 
Exclusive lock escalations = 0 

Agents currently waiting on locks = 0 

Lock Timeouts = 0 

Number of indoubt transactions = 0 

Total Private Sort heap allocated = 0 

Total Shared Sort heap allocated = 36 

Shared Sort heap high water mark = 1137064 

Post threshold sorts (shared memory) = 0 

Total sorts - 10567804 排序 相关 信息 
Total sort time (ms) = 20295003 

Sort overflows = 221840 

Active sorts =? 

Buffer pool data logical reads = 2109551727 

Buffer pool data physical reads = 5176050 

Buffer pool temporary data logical reads = 10683339 

Buffer pool temporary data physical reads = O0 

Asynchronous pool data page reads = 664237 缓冲 池 相 关 信 息 
Buffer pool data writes = 1190909 

Asynchronous pool data page writes = 1188306 

Buffer pool index logical reads = 1771670606 


使 用 下 面 的 命令 ， 可 以 得 到 数据 库 FLIGHTDB 汇总 的 快照 信息 : 


db2 get snapsot for all on FLIGHTDB 


所 有 的 快照 信息 都 可 以 通过 执行 RESET MONITOR 命令 归 零 。 这 个 命令 的 基本 语法 是 (其 
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中 <dbname> 为 数据 库 名 称 ) : 


db2 reset monitor [for [[database | db] «dbname»] | all] 


6.3.2. 事件 监视 器 


事件 监视 占 收 集 特定 事件 发 生 时 的 监控 数据 ,例如 事务 提交 、SQL 语句 执行 完成 或 者 死 锁 
等 等 。 事 件 监 视 融 必须 先 由 用 户 创 建 ， 可 以 手动 打开 和 关闭 。 一 旦 打开 后 ， 事 件 监视 亏 束 会 不 
断 捕获 相关 事件 的 信息 。 你 可 以 创建 多 个 事件 监视 项， 然后 根据 需要 打开 和 关闭 它们 ， 丈 活 人 三 
定 监 控 的 时 间 和 范围 。 表 6-4 列 出 了 事件 监视 亏 所 监控 的 事件 以 及 收集 数据 的 内 容 和 时 间 点 。 


表 6-4 ”监控 事件 以 及 收集 数据 的 内 容 和 时 间 点 
事件 监视 器 类 型 收集 时 间 点 
DATABASE 所 有 数据 库 连接 断 开 
BUFFERPOOLS 缓冲 池 信 息 、 预 取 程 序 CPrefetcher) 信 | 所 有 数据 库 连 接 断 开 


AB 
E REB 


TABLESPACES KTN IO 信息 、 与 表 空 间 相 关 的 缓冲 | 所 有 数据 库 连 接 断 开 


池 信 息 等 


TABLES 对 每 个 表 读 取 或 写 入 的 行 数 所 有 数据 库 连 接 断 开 

CONNECTIONS 所 有 应 用 程序 级 别 的 计数 器 数据 库 连接 结束 

STATEMENTS SQL 语句 执行 结束 SQL 语句 开始 和 停止 的 时 间 、 CPU 
时 间 、SQL Xx. SQL 语句 的 返回 
码 等 

DEADLOCKS 发 生死 锁 时 

ACTIVITIES SQL 语句 和 编译 环境 等 信息 服务 类 、 工 作 负 载 或 工作 关中 所 执行 
活动 完成 时 

STATISTICS 根据 每 个 服务 类 、 工 作 负载 或 工作 类 内 | 每 隔 预定 时 间 


的 活动 数据 计算 而 来 的 统计 信息 


THRESHOLD 闷 值 违例 信息 检测 到 羡 值 违例 时 
VIOLATIONS 


局 
UNIT OF WORK 事务 相关 的 信息 在 事务 完成 时 


事件 监控 器 用 于 捕获 快照 监控 器 捕获 不 到 的 信息 , 例如 死 锁 循环 的 相关 信息 。 实 际 上 ,DB2 
中 有 一 种 称 为 死 锁 检测 器 的 后 人 台 代 理 程序 ， 会 按 预 定义 的 时 间 间 隔 被 唤醒 ， 在 锁定 系统 中 扫 摘 
死 锁 循环 。 如 果 检 测 到 死 锁 循环 ， 死 锁 探 测 器 会 随机 选择 、 回 滩 并 终止 此 循环 中 的 一 个 事务 ， 
以 释放 此 事务 获得 的 锁 ， 使 其 余 事务 能 够 继续 执行 。 这 些 事件 无 法 被 快照 监 探 堪 捕获 ， 因 为 当 
你 获取 快照 时 ， 死 锁 循 环 可 能 已 经 被 检测 到 并 解除 了 。 而 监控 锁 事 件 的 事件 监控 器 却 可 以 在 死 
锁 循 环 被 检测 到 时 立即 激活 ， 并 记录 相关 的 重要 信息 。 除 了 处 理 死 锁 等 特殊 事件 ， 事 件 监 视 器 
还 能 记录 查询 语句 的 开始 和 结束 时 间 ，CPU 使 用 时 间 等 一 系列 信息 。 

下 和 面 来 看 一 下 如 何 创建 事件 监视 器 .事件 监视 器 需要 通过 执行 CREATE EVENT MONITOR 
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语句 创建 。 此 语句 的 基本 语法 是 : 
>>-CREATE EVENT MONITOR--event-monitor-name--FOR---------------- > 


>----+-+-DATABASE--------------------------------------------- 十 -十 -十 一 一 > 

+-TABLES----------------------------------------------- + | 

+-LOCKING--+--------------------------------------- +-+ | 

+-TABLESPACES------------------------------------------ + | 

'-BUFFERPOOLS------------------------------------------ i 

'-+-CONNECTIONS--+--+---------------------------- + 一 一 一 一 一 一 一 一 一 ! 
T=-STATEMENTS===+ "-MHBRE==-| ne 


Z WREE IOS m ABIE Meyn group intro cuc Toa Jarc ncesi > 
T- elbe pipe- name = ciie ee F 


!'-PFPILE==-path=-name==| File=+options |=" 


. -MANUALSTART-. 


I OLD AN ONNO clo e cr ee OE 
OCAD 


!=GLOBAL= 


例如 ， 可 以 使 用 下 面 的 语句 创建 SQL 语句 事件 监视 占 MYEM， 它 将 记录 应 用 程序 APPI 
以 用 户 MYUSER 访问 数据 库 时 执行 的 语句 信息 。 这 里 指定 了 “write to table" 选项 ， 这 使 得 
DB2 在 创建 MYEM 的 同时 ， 会 在 当前 用 户 模 式 下 和 面 创建 一 些 表 ， 以 便 将 事件 发 生 时 收集 的 信 
EE Ax, 


人 
'MYUSER' write to table" 


通过 下 面 的 list tables 命令 ， 可 以 看 到 创建 的 用 于 存放 事件 信息 的 三 张 表 : 
CONNHEADER MYEM 《事件 监视 相关 的 连接 信息 ) 、CONTROL MYEM 《事件 监视 相关 的 
控制 信息 ) 和 STMT_MYEM (事件 监视 器 所 收集 的 语句 信息 ) 。 注 意 ， 这 些 表 的 表 名 都 以 事件 
监视 器 名 称 即 MYEM 结尾 。 


=> db2 list tables |grep MYEM 


CONNHEADER MYEM MYUSER T 2012=-11=07-=-5.20.45,214101 
CONTROL MYEM MYUSER T 2012=11=07=5.-20.45:3395244 
STMT MYEM MYUSER T 2012=11=-07=75:20-45. 736973 


使 用 set event monitor 语句 打开 MYEM: 


db2 set event monitor MYEM state 1 
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这 样 ， 当 监控 的 应 用 程序 连接 数据 库 、 执 行 SQL 语句 或 者 最 后 断 开 数 据 库 时 ， 事件 监视 器 
都 会 进行 监控 并 将 收集 到 的 SQL 语句 信息 存 入 STMT MYEM 等 三 张 表 中 。 可 以 使 用 下 面 的 语 
名 关闭 MYEM: 


db2 set event monitor MYEM state 0 


然后 ， 通 过 会 询 表 STMT_MYEM， 可 以 得 到 每 条 SQL 语句 的 各 种 信息 ， 包 括 开 始 执行 和 
结束 时 间 、CPU 时 间 以 及 排序 时 间 等 。 例 如 ， 利 用 下 面 的 得 询 ， 可 以 得 到 其 中 耗费 CPU 时 间 


最 多 的 语句 : 


-»db2" select STMT TEXT from STMT MYEM order by SYSTEM CPU TIME + USER CPU TIME fetch 


FLSE row only” 


STMT TEXT 


select t.tabname, i.indname from syscat.tables t, syscat.indexes i where t.tabname 


= i tabname anc coalesce(lt.1index tospace, 七 .七 SBDaCS) 9 


TTAR, HAERA. RME . AREE ER AST E 
了 AUTOSTART XW, Zi FE Ug SN. A EN REB tT A o 

在 上 面 创 建 事件 监视 器 时 指定 将 收集 的 信息 写 入 表 。 其 实 也 可 以 将 信息 写 入 指定 的 管道 或 
者 文件 。 如 末 指 定 写 入 文件 ， 需要 指定 一 个 已 存在 的 文件 来 。 信息 收集 完毕 后 ,使 用 db2evmon 
格式 化 收集 到 的 信息 。 其 体 方法 如 下 。 

H 7c GJ d — 474 CONNEM 的 事件 监视 器 ， 用 于 监控 数据 库 连 接 。 这 里 指定 了 “write to 
file” 选 项 ， 将 收集 的 事件 信息 写 入 目录 “Ahomemyuser/eventmonitor ”下 的 文件 。 


Create event monitor CONNEM for connections write to file 


'/home/myuser/eventmonitor' 


经 过 打开 监视 器 、 收集 信息 和 最 后 关闭 的 过 程 后 , HT ELTE H K " /home/myuser/eventmonitor " 
下 看 到 存放 事件 信息 的 文件 。 使 用 下 面 的 db2evmon 命令 ， 就 可 以 得 到 格式 化 的 事件 信息 ， 从 
中 可 以 看 出 每 个 连接 的 应 用 程序 名 、 用 户 名 和 连接 时 间 每 信息 。 

# 查 看 /home/myuser/eventmonitor 目录 下 的 文件 


-» ls -ltr /home/myuser/eventmonitor 


total 24 
= PW- ET 1 myuser pdxdb2 31 Nov 08 01:03 db2event.ctl 
=P= r= r= 1 myuser pdxdb2 4543 Nov 08 01:03 00000000.evt 


# 使 用 db2evmon 对 事件 信息 进行 格式 化 ，-path 选项 指定 事件 信息 存放 的 目录 


=>db2evmon -path '/home/myuser/eventmonitor' 


Reading /home/myuser/eventmonitor/00000000.evt ... 
EVENT LOG HEADER 
Event Monitor name: CONNEM 
Server Product ID: 507090359 
Version of event monitor data: 9 
Byte order: BIG ENDIAN 


Number of noces im clo? eee el 
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Codepage of database: 819 

Territory code of database: 1 

Server instance name: myuser 

Database Name: FLIGHTDB 

Database Path: /home/myuser/myuser /NODE0000/S9QL00001/ 
First Connection timestamos 11/08/2012 23:49:50,572444 
Event Monitor Start Ttime? 11/08/2012 01:03:;21,.246989 


1) Connection Header Event ... 
Appl Handle: 57 
Appl Icd: “LOCAL. museo 2111090096399) 
Appl Seq number: 00003 
DRDA AS Correlation Token: ~ LOCAL. myuser,111221065737 
Program Name : db2bp 连接 对 应 的 应 用 程序 名 
Authorization Id: MYUSER 冬 连 接 对 应 的 用 户 和 名 
Execution Ial : myuser 
Codepage Id: 819 
Territory code: 1 
Client Process Id: 6608596 
Client Database Alias: FLIGHTDB 
Client Product Ics SOL0O905G 
Client Platform: Unknown 
Client Communication Protocols Local 
Client Network Name: matthaus 


Connect timestamp: 11/08/2012 00:57:37.921527 < 连接 建立 的 时 间 


6.3.3 ”监视 器 表 函 数 


为 了 让 用 户 能 以 SQL 语句 的 形式 方便 地 获得 监控 信息 ，DB2 从 V8.1 版 本 开始 ， 提 供 了 监 
MarK žr (Monitoring Table Functions) 。 在 V8.1 中 ，DB2 þett T RŽ L “SNAPSHOT ” 
开头 的 表 函 数 ; 在 V9.1 中 ， 又 以 一 组 “SNAP_ GET_ ”开头 的 函数 代替 。 这 里 重点 介绍 以 

“SNAP GET ”开头 的 这 组 表 函 数 。 
下 和 面 的 但 询 可 以 列 出 DB2 文 持 的 所 有 以 “SNAP_ GET. ”开头 的 监视 带 表 函数 : 


db2 "select substr(funcname,1,50) from syscat.functions 
where funcname like 'SNAP GET 4$'" 


表 6-5 列 出 了 常用 的 监控 对 象 、 对 应 的 表 函 数 名 和 返回 的 信息 。 


表 6-5 ”监视 器 表 函 数 的 监控 对 象 、 表 函数 名 和 返回 的 信息 
EF, 


mm 返回 的 信息 


应 用 程 SNAP GET APPL 应 用 程序 快照 信息 〈 如 读 取 行 数 、 更 新 行 数 等 ) 
oS 应 用 程序 基本 信息 〈 如 应 用 程序 和 名称、 状态 等 ) 


绥 冲 池 """ 攻 
SNAP GET BP Zi rp p BG fei Ad 
( Bufferpool) 
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CEK) 
监控 对 象 RRAZ 返回 的 信息 
SNAP GET DB 数据 库 快照 信息 
SNAP GET DBM 数据 库 管理 器 快照 信息 
数据 库 SNAP GET HADR HADR 快照 
( Database) 数据 库 的 存储 路 径 及 其 所 在 文件 系统 的 可 用 至 
SNAP GET STORAGE PATHS | | . 
TR] f 
SNAP GET STO PATHS 数据 库 的 存储 路 径 
日 志 (Log) SNAP GET DETAILLOG 日 志 信 息 
. SNAP GET DYN SQL 动态 SQL 语句 快照 信息 
SQL 语句 (SQL 、 "m 
所 有 SQL 语句 的 快照 信息 (包括 动态 和 静态 
Statement ) SNAP GET STMT 
SQL) 
| SNAP GET LOCK 锁 快 照 信 息 
Wi (Lock) " 
SNAP GET LOCKWAIT 锁 等 每 快照 信息 
表 (Table) SNAP GET TAB 表 的 快照 信息 〈 如 读 取 行 数 、 写 入 行 数 等 ) 
d RJ SNAP GET CONTAINER 表 空 间 容器 信息 
(Tablespace) SNAP GET TBSP de ^ [RID RR fet A 
l SNAP GET _ UTIL 实用 程序 信息 《类 型 、 优 先 级 等 ) 
实用 程序 - "dn 
AME SNAP GET UTIL PROGRESS 实用 程序 的 状态 信息 
tility o, I 
SNAP GET TAB REORG 表 重 组 信息 〈 表 名 、 重 组 类 型 、 状 态 等 ) 


衬 信 息 ， 你 需要 先 打开 相应 的 实例 级 快照 监控 


zud 
zm 
Hr 


注意 ， 要 利用 上 述 监视 器 表 函 数 获 取 快 民 
开关 (如 DFT MON BUFPOOL) 。 

使 用 监视 器 表 函 数 可 以 方便 获得 各 种 快照 信息 。 例 如 ， 针 对 下 面 的 查询 ， 可 以 利用 表 函 数 
SNAP GET TAB 获得 数据 库 FLIGHTDB 的 表 读 取 和 写 入 〈 包 括 插入 和 更 新 ) 的 行 数 。 参数 
“一 1” 表 示 对 当前 连接 的 数据 库 分 区 《如 末 为 多 分 区 数据 库 ) 获取 此 快照 。 从 ROWS READ 
和 ROWS_ WRITTEN 列 可 以 分 别 看 到 每 个 表 读 取 和 写 入 的 行 数 。 


—2db2 'selteet TABNAME, ROW READ, ROWSOWRITTEN Eromtable(5NAPOGET OTAB((ERTGHTDB, -1))" 


TABNAME ROWS READ ROWS WRITTEN 
SYSTABLES 56 0 
BLIGHLTDB I 229389 


从 DB2 V9.7 开始 ， 可 以 通过 监视 表 函 数 来 代 蔡 传统 系统 监视 器 命令 对 DB2 进行 监控 。 这 
些 表 浮 数 增强 了 收集 和 查看 系统 活动 和 数据 对 象 数据 的 能 力 。 而 且 与 传统 监视 占 相 比 ， 这 种 轻 
量 级 的 表 函 数 对 系统 的 影响 更 小 。DB2 的 监控 表 函 数 分 为 系统 监控 表 水 数 、 活 动 监控 表 函 数 和 
对 象 监 控 表 函数 。 
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1. 系统 监控 表 函 数 


下面 是 可 以 用 来 访问 系统 级 别 监视 信息 的 表 函 数 : 
e MON GET SERVICE SUBCLASS fll MON GET SERVICE SUBCLASS DETAILS. 
e MON GET WORKLOAD 和 MON GET WORKLOAD DETAILS. 
e MON GET CONNECTION 和 MON GET CONNECTION DETAILS. 
e MON GET UNIT OF WORK fll MON GET UNIT OF WORK DETAILS. 
这 组 表 函 数 使 你 能 够 得 到 特定 详尽 程度 的 监控 信息 。 它 们 是 成 对 存在 的 : 一 个 表 函 数 用 于 
对 第 用 数据 进行 访问 ， 另 一 个 表 函 数 用 于 对 全 部 可 用 的 监控 信息 进行 访问 。 
缺 省 情况 下 ， 这 些 表 函 数 将 目 动 收集 系统 监控 信息 。 你 可 以 使 用 下 列 方法 更 改 缺 省 设置 : 
(1) 利用 数据 库 配 置 参数 mon req metrics 指定 所 有 服务 类 的 最 低 收 集 级 别 。 此 参数 可 以 
WA: NONE (不 收集 监控 信息 ) 和 BASE (收集 所 有 监控 信息 )〉。 
(2) 利用 CREATE/ALTER SERVICE CLASS 语句 的 COLLECT REQUEST METRICS Ý 
名 指定 服务 类 的 收集 级 别 。 使 用 此 设置 来 将 特定 服务 类 的 收集 级 别 增 大 为 高 于 mon req metrics 
的 级 别 。 这 里 也 是 可 以 将 级 别 设 为 NONE 和 BASE. 
例如 ， 如 果 只 收集 部 分 服务 类 的 系统 监视 信息 ， 请 执行 下 列 操作 ， 将 数据 库 配 置 参 数 
mon req metrics 设置 为 NONE。 


=> db2 update db cfg using MON REQ METRICS NONE 
DB200001 The UPDATE DATABASE CONFIGURATION command completed successfully. 


(3) 对 于 每 个 希望 搜集 监控 信息 的 服务 类 ， 将 CREATE/ALTER SERVICE CLASS 语句 的 
COLLECT REQUEST METRICS 子 句 设置 为 BASE. 


=> db2 alter service class sl collect request metrics base 


DB20000I The SQL command completed successfully. 


2. 活动 监控 表 函 数 


活动 是 指 SQL 语句 的 执行 行为 。 活 动 监 视 表 函数 用 于 得 到 SQL 语句 执行 的 各 个 方面 的 数 
据 ， 以 及 SQL 语句 文本 等 其 他 信息 。 活 动 相 关 的 信息 将 随 着 活动 的 进行 在 内 存 中 累积 。 而 与 
SQL 语句 活动 直接 相关 的 信息 ， 还 随 着 SQL 语句 的 每 次 执行 在 高 速 缓冲 中 累积 。 

使 用 表 函 数 MON GET ACTIVITY DETAILS 和 MON GET PKG CACHE STMT 可 以 访 
问 活动 的 当前 数据 。MON GET ACTIVITY DETAILS 以 XML 格式 返回 活动 数据 。 
MON GET PKG CACHE STMT 返回 特定 SQL 语句 所 有 执行 的 归 总 数据 。 

例如 ,使 用 下 面 的 查询 可 以 查看 消耗 CPU 时 间 最 多 的 前 10 个 动态 SQL 语句 。 将 参数 “D” 
改 为 “S”, 可 以 得 到 对 应 静态 SQL 语句 的 结果 , 改 为 NULL 则 得 到 对 应 所 有 SQL 语句 的 结果 : 


select STMT TEXT 

trom table(mon get pkg cache ees CD NULL, NULL, =2)) as T 
order by total cpu time 

fetch first 10 rows only 


STMT TEXT 
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SELECT TABNAME PROM SYXSCAT. TABLES WARRE TABNAME=" HMON COLLECTLIEON Y s: 
SELECT TABNAME FROM S DG STI WHERE TABNAME=" HMON ATM INFO" AND so: 

UPDATE SYSTOOLS. HMON ATM INEO AS ATM SET STATS FLAG = "N" WHERE (ATM, SCHEMA s 
SELECT POLICY FROM SYSTOOLS.POLICY WHERE MED='DB2TableMaintenanceMED' 


EH Pf HJ eg n] ELE 5] Hb dX HotTableName» 1 2]: SQL, JE pool data p reads. 
pool data writes 和 num executions 列 放 入 order by 子 句 ， 分 别 可 以 得 到 读 、 写 和 执行 次 数 最 多 
的 10 个 动态 SQL 语句 。 将 参数 “D” 改 为 “S”， 可 以 得 到 对 应 静态 SQL 语句 的 结果 ， 改 为 
NULL 则 得 到 对 应 所 有 SQL 语句 的 结 


select ~“ 

trom table(mon get pkg cache mm 有 NULL, NULL, =2)) as T 
niere r otme = 人 = 

order by .… 

fetch first 10 rows only 


使 用 下 面 的 查询 可 以 查看 访问 索引 页 最 多 的 10 个 动态 SQL 18 5], «TableNameForHotIndex^ 
为 热 索 引 对 应 的 数据 表 名 。 将 参数 “D” 改 为 “$”， 可 以 得 到 对 应 静态 SQL 语句 的 结果 ， 改 
为 NULL 则 得 到 对 应 所 有 SQL 语句 的 结 


select 5 

ET OM Eo nensis de pkg cache sime CED NU NULL 2 cs UR 
ie 

order by pool index p reacs dese 


teteh first 10 rows only 


使 用 下 面 的 查询 可 以 查看 被 返回 的 数据 行 数 与 被 访问 数据 行 数 比 例 最 低 的 10 个 SQL 语句 ， 
包括 静态 和 动态 SQL， 这 也 是 执行 成 本 较 高 的 SQL 语句 : 


select ” 

from čabole(mon gert pkg cache stmt (NULG, NULG, NULL, =2)) as T 
where rows read <> 0 

Omoleu oy Ore e nane o ese sse 


treten espe 10 rows only 


RARA F, DB2 会 目 动 收集 活动 监视 信息 。 你 可 以 使 用 下 列 设置 中 的 一 个 或 全 部 来 更 改 
缺 省 设置 : 
(1) 利用 mon act metrics 数据 库 配 置 参数 指定 所 有 工作 负载 的 最 低 收 集 级 别 ， 默 认 值 为 
BASE， 即 自动 收集 。 也 可 以 将 mon act metrics 设置 为 NONE， 从 而 不 收集 活动 监视 信息 。 


=> db2 update db cfg using mon act metrics none 
DB200001 The UPDATE DATABASE CONFIGURATION command completed successfully. 


(2) 利用 CREATE/ALTER WORKLOAD i& JI] COLLECT ACTIVITY METRICS 子 句 指 
XE 28 4E LL. TE fa 2 ERI ACA 2C Crea o8] DUREE E 16 236 LER] e ACH ZEE D 。 

(3) 将 CREATE/ALTER WORKLOAD 语句 的 COLLECT ACTIVITY METRICS 子 句 设置 
为 BASE。 缺 省 情况 下 ， 其 他 工作 负载 的 值 为 NONE。 


=> db2 create workload wl system user('DB2INST1') collect activity metrics base 
DB20000I The SQL command completed successfully. 
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3. 数据 对 象 监视 表 防 数 


提供 操作 数据 对 象 〈( 即 表 、 索 引 、 绥 冲 池 、 表 空间 和 容器 〉 的 相关 信息 。 对 于 每 种 对 和 象 类 
型 ， 都 有 一 组 不 同 的 监控 信息 。 每 当 数 据 对 象 被 处 理 时 ， 该 对 象 的 监控 信息 都 将 递增 ,例如 ， 
在 从 特定 表 中 读 取 行 时 ， 该 表 的 “ 读 取 行 数 ” 值 将 递增 。 

可 以 使 用 下 列表 函数 访问 数据 对 象 的 当前 信息 ， 这 些 表 函 数 返 回 当前 数据 ， 但 你 无 法 访问 
数据 对 象 的 历史 数据 。 

e MON GET BUFFERPOOL; 

e MON GET TABLESPAC; 

e MON GET CONTAINER; 

e MON GET TABLE; 

e MON GET INDEX. 

例如 ， 可 以 使 用 下 面 查 询 碍 看 缓冲 池 命 中 率 : 


select * from table(mon get burtterpool("",=2)) as metrics 


下 面 的 查询 可 以 查看 被 访问 数据 行 数 最 多 的 表 : 


select tabschema, Tabname, Sun(rows read) as total rows read 
trom table (mon get table("",“",=2)) as T 

group by tabschema, tabname 

Order boy total rows read 


teten first cow only“ 

数据 对 象 监 探 信 息 是 否 收集 ， 由 数据 库 配 置 参 数 mon obj metrics 来 定义 。 如 果 它 的 值 为 
BASE， 则 收集 数据 对 象 监 探 信息 ; 如果 值 为 NONE 则 不 收集 ， 例 如 下 面 的 语句 设 定 其 值 为 
NONE. 


=> db2 update db cfg using mon_obj_metrics none 
DB20000I The UPDATE DATABASE CONFIGURATION command completed successfully. 


E 


À- IU F za ENT 
Aa 注意 : 有 两 个 表 函 效 不 受 mon_obj 
无 论 mon obj metrics 参数 怎么 设置 ，DB2 都 将 搜集 表 函 数 MON GET TABLE 和 
MON GET INDEX 相关 的 监控 数据 。 
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6.3.4 ”省 理 视 图 


从 V9.1 开始 ，DB2 提供 了 一 套 管理 视图 (Administrative Views) ， 用 于 方便 获取 数据 库 监 
探 信息 。 利 用 这 些 管理 视图 ， 一 方面 可 以 获得 原来 需要 用 快照 命令 或 监视 器 表 函 数 才 能 获得 的 
信息 (例如 ， 利 用 视图 SNAP. BP 可 以 获得 缓冲 池 的 快照 信息 ) ; 男 一 方面 ， 也 可 以 得 到 在 这 
些 信息 之 上 计算 出 来 的 结果 (例如 ， 利 用 视图 BP HITRATIO 可 以 直接 获得 各 个 缓冲 池 的 命中 
率 ) ， 这 些 结果 是 由 视图 通过 快照 信息 计算 而 来 的 。 

这 些 管理 视图 的 模式 都 为 SYSIBMADM, 通过 db2 list tables for schema SYSIBMADM 可 以 
获取 所 有 管理 视图 的 列表 : 
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—» db2 list tables for schema SYSIBMADM 


Table/View Schema Type Creation time 

ADMINTABINFO SYSIBMADM M 2012=11-=03=13.55.92.309004d 
APPLICATIONS SYSIBMADM V 240 vuelos 3 55 5 人 30539032 
APPL PERREFORMANCE SYSIBMADM V 2012=11=-03=13.55:52,309036 
AUTHORIZATIONIDS SYSIBMADM V 2012=11-03=-13,55,.52,.293011 
BP HITRATIO SYSIBMADM M 2012=11=03=13.,55,.52,324003 
BP READ IQ SYSIBMADM V 2012=11=03=-13., sS Sc SEI 
BP WRITE ITỌ SYSIBMADM V 2012=11=-03=13.55,.52,324011 
CONTACTGROUPS SYSIBMADM V 2012=11=-03=13.,55.52,.309012 
CONIACIS SYSIBMADM V 2012=11=-03=-13.55.52,.309016 
CONTAINER UTILIZATION SYSIBMADM V 2012=11=-03=-13.55.52.324015 
DBCFG SYSIBMADM V 2012=11-03=13.55,.52.309020 
DBMCFG SYSIBMADM V 0 00 
DERAS SYSIBMADM V 2012=11=-03=13.55,52 309028 
IBI EO SYSIBMADM M 2012=11=-03=13,.55,.,52,.293003 


意 ， 和 监视 占 表 函数 类 似 ， 要 利用 省 理 视图 获取 快照 监控 信息 ， 需 要 先 打 开 相 应 的 实例 
MEM 
如 朱 系 统 的 用 户 CPU 时 间 don ur sysibmadm.snapdyn sql "F {X#E 
HP CPU 时 间 排 列 所 有 的 动态 SQL 语句 ， 通 第 只 需要 关注 返回 结 来 的 前 儿 行 动态 SQL i84): 


select STMI XT. 


from sysibmadm.snapdyn_sql 


order by total usr cpu time desc 


S RB XT. 
select * from DB2INST1.LOCATION ql where ( q1."LOCATIONCODE" = ?) and 
(gl."LOCATIONTYPE™ = 'AD') and ( q1."STARTDATE"™ <= ?) and ( q1."ENDDATE" >= ?) and 
( q1."“ACTIVERECORD™ = ?) 
select * from DB2INSTI.ORGANISATION q1 where ( q1."ORGANISATIONCODE" = ?) and 
( q1."ORGANISATIONTYPE" = 'OPR') and ( q1."STARTDATE" <= ?) and (gl."ENDDATE" >= ?) 
end esegue YACTIVERECORDY = YYY) 
select ~ from DBZINSTI -ROUTE ql where ( gil,  BOUTSCOODE V = ?) anel 
(ear YROUTEDESCRIPTORY = ?) anc) ( ql. YSTARTDATEY <= ?) anc) ( @l, VENDDATEY >= ?) 
Select * from DB2INST1.ROUTE ql where ( dl."ROUTECODE™ = ?) and 
( q1." ROUTEDESCRIPTOR" = ?) and (? >= ql.“STARTDATE") and (? <= ql." "ENDDATE") 


6.3.5 db2pd 


db2pd 工具 是 独立 运行 于 DB2 引擎 之 外 的 诊断 工具 。 它 可 以 奏 看 数据 库 的 各 种 状态 信息 ， 
主要 用 于 对 特定 问题 的 监控 和 故障 诊断 。 这 里 重点 介绍 如 何 使 用 db2pd 进行 一 般 性 的 监控 。 
与 前 面 儿 节 提 到 的 快照 、 事 件 监视 峰 等 工具 相 比 ， 使 用 db2pd 进行 监控 有 以 下 优点 : 
e db2pd 直接 从 DB2 的 内 存 中 读 出 信息 ， 不 需要 连接 数据 库 ， 所 以 不 会 像 快照 或 事件 监 
视 占 那样 占用 数据 库 引 擎 资源 
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e db2pd 收集 信息 时 不 会 请 求 任何 锁 ， 所 以 它 获 取信 息 的 速度 很 快 。 

e db2pd 提供 的 信息 比 其 他 的 监控 方式 更 确 层 也 更 丰 宇 。 比 如 数据 库 挂 起 时 ，DB2 已 经 
无 法 接受 外 部 连接 ， 这 时 只 能 通过 db2pd 获取 诊断 信息 。 另 外 ， 对 于 新 的 监控 信息 ， 
DB2 一 般 先 通过 db2pd 提供 ， 随 后 再 由 其 他 途径 提供 。 人 例如， 有些 索引 、 表 和 SQL 信 
上 县， 先是 通过 db2pd 的 某 些 选项 提供 ， 随 后 从 DB2 V9.7 开始 相应 的 监视 器 表 孙 数 也 所 
供 类 似 的 但 看 功能 ， 如 表 6-6 所 示 : 


表 6-6 db2pd JAINA R A AAI XT 


db2pd 选项 AF Z EE sd ES 
db2pd -tcbstats index mon get index 
db2pd -tcbstats mon get table 
db2pd -static mon get pkg cache stmt 


人 注意 : db2pd 收集 的 信息 有 时 不 准 
在 db2pd 收集 信息 时 ， 有 可 能 会 检索 到 正在 被 更 改 的 数据 ,这 时 返回 的 数据 可 能 不 精 
确 。 另 外 ， 如 果 遇 到 正在 更 改 的 内 存 ， 会 导致 db2pd 的 输出 信息 中 包含 这 样 的 消息 : 
“Changing data structure forced command termination" ,这 时 只 需 重 新 执行 db2pd 命 令 即 可 。 


db2pd 有 很 多 选项 ， 提 供 关 于 事务 、 表 空间 、 表 统计 信息 、 动 态 SQL 以 及 数据 库 配 置 等 信 
o 用户 只 要 输入 db2pd -everything， 束 会 列 出 能 提供 的 所 有 信息 。 如 来 想 限 定 输出 的 范围 ， 
可 以 使 用 下 6-7 中 的 选项 : 


表 6-7 db2pd 用 于 限制 输出 范围 的 选项 


选项 信息 
Ins 输出 实例 相关 信息 
db <dbname> 输出 数据 库 <dbname> 的 相关 信息 
Alldb 和 输出 所 有 数据 库 信息 
dbp «partitionnum- 输出 数据 库 分 区 <partitionnum> 的 信息 
Alldbp 输出 所 有 数据 库 分 区 的 信息 
Osinfo 输出 操作 系统 相关 信息 


db2pd 用 于 获得 数据 库 对 象 信息 的 选项 可 以 分 为 实例 和 数据 库 两 个 层次 。 实 例 层 次 的 选项 
有 agents. fcm 等 ， 如 表 6-8 所 示 : 


表 6-8 db2pd 实例 层次 的 选项 


选项 信息 
Agents 输出 DB2 代理 (Agent) 的 相关 信息 
Fcm 输出 多 分 区 数据 库 中 的 快速 通信 管理 顷 (FCM) 信息 
Mempools 输出 内 存 池 相关 信息 
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CRK) 
选项 信息 
Dbmcfg 输出 DBM 配置 信息 ， 等 同 于 get dbm cfe 命令 ， 但 输出 格式 稍 有 不 同 
Utilities 输出 正在 执行 的 实用 程序 的 相关 信息 
数据 库 层 次 的 选项 有 applications, transactions 等 ， 如 表 6-9 所 示 : 
表 6-9 db2pd 数据 库 层次 的 选项 

选项 B 

Applications 输出 应 用 程序 信息 ， 同 时 还 有 很 多 相关 子 选 项 用 于 更 精确 的 输出 某 个 应 用 程序 的 
相关 信息 

Transactions 输出 数据 库 的 事务 信息 
Bufferpools 输出 数据 库 的 绥 冲 池 信 息 
Logs A d 28698 FE ER] Hz i s. 
Locks Ay ch 2C EIU A. 
Reorgs 输出 数据 库 的 表 重 组 信息 


下 面 举 一 些 使 用 db2pd 进行 监控 的 实例 。 
使 用 db2pd -app， 可 以 看 到 当前 正在 运行 的 应 用 程序 的 状态 。 例 如 ， 从 下 面 的 输出 可 以 看 
4$], f 57 的 应 用 程序 处 于 UOW-Executing 状态 ， 即 正在 执行 事务 。 


z ule ele -app rele FLIGATDB 


Database Partition 0 ==- Database FLIGHTDB == Active == Up 2 days 23304311 
Applications s 

Address AppHandl [nod-index] NumAgents CoorTid Status Ty onem 
0x000000069C6692A0 57 1000-00701] 1 38008 UOW-Waiting 236 
0x000000069C664940 735 [L000=00735] 1 4876 UOW-Waiting 159 
0x000000069FID3DCO 1376 [000-011376] 1 4296 UOW-Waiting 3B 
0x000000069F1D3CC0 1372 (000=01372] 1 2972 UOW-Waiting 137 


接 下 来 ， 利 用 db2pd -activestatements 可 以 得 到 正在 执行 的 语句 的 AnchorID 为 236， 这 个 
ID 可 以 作为 SQL 语句 的 标识 符 在 包 绥 冲 中 找到 对 应 语句 。 


=> db2pd -activestatements -db FLIGHTDB 
Database Particion 0 == 0 


Active Statement List: 
Address AppHandl [nod-index] UOW-ID SED ANCAID SEmEUID BEEISO 


0x0700000053742420 57 1000-00057] 9 1 236 1 0 


使 用 db2pd -dyn 4i ti £u ZE P P S PEE dx SQL, 根据 AnchorID 可 以 进一步 查 到 SQL 语句 
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的 文本 ， 这 吏 是 句柄 为 57 的 应 用 程序 正在 执行 的 语句 。 


-»db2pd -dyn -db FLIGHTDB 
Database Partition 0 -- Database FLIGHTDB -- Active -- Up 2 days 23:04:40 


Dynamic SQL Statements: 

Address AMGNnID SEmEULID NumEnv NumVar NumRef NumExe Text 

0 交 970000005368 7AAU 175 1 1 1 $ $ 

select distinct MESSAGESOURCE from DB2INST1.DATAINTEGRITYMESSAGE as basetable 
where lower (basetable.PROCESSNAME) LIKE '$$' FOR READ ONLY 


0x070000005373FDA0 236 1 1 l 2 2 


select * from sysibmadm.snapdyn sql order by total usr cpu time desc 


db2pd 是 一 个 非 营 强大 的 监控 工具 ， 它 提供 了 观察 数据 库 内 部 状态 的 途径 ， 运 维 人 员 应 该 
AMZK 3E de ox AI) a 


6.3.6 db2top 


db2top 是 一 个 强大 的 、 基 于 单一 视图 的 监控 工具 。 使 用 db2top 监控 数据 库 ， 类 似 于 Unix 
操作 系统 中 的 top 命令 监控 主机 状态 ， 它 在 运行 过 程 中 会 不 断 刷 独 ， 从 而 提供 实时 的 监控 信息 。 

db2top 文 持 AIX, Linux 和 Solaris 等 三 种 平台 ， 并 且 在 DB2 V8 FP17、DB2 V9.1 FP6 以 及 
DB2 V9.5 FP2 以 上 版 本 才 可 以 使 用 。 

图 6-1 是 db2top 的 初始 界面 (输入 命令 “db2top -d < 数据 库 名 >” 后 可 以 看 到 ) 。 其 中 列 
出 了 各 种 选项 (如 d 一 Database， 用 于 获得 数据 库 整 体 状态 ) ， 输 入 这 些 选 项 (例如 输入 “d”) 
束 可 以 查看 相应 的 具体 监控 信息 了 。 


[1]22:52:498, refresh=2secs (0.003Y Linux,member-[1/1],DB21NST1:5AMPLE 
[d=Y, a=N., e=N, PALL] [ar-otft] 


FFF EFO  $5$$959 FEFFE FERREE IIl For help type h or ... 


$ $ $ $ $ z zi z 地 $ # db2top -h: usage 
# $ # * # # $ # f $ 

$ $ f52255 z2zz2z z $ + EHHE Status: Active 
z LE * ot - r3 f id Uptime: D06m:56s 
t $ # $ # # # 2E: Last backup 
FEEFEE PEHEE HEHEHHE # FEEFEE $ Hone 

DB2 Interactive Snapshot Monitor V2.0 

Use these keys to navigate: 

d — Database I 一 Sessions a 一 Agent 

t — Tablespacez b 一 Butfterpools T 一 Tables 

D - Dynamic SQL U - Locks m 一 Memory 

s 一 Statements p 一 Members u — Utilities 

A&A 一 HADR F 一 Federation B - Bottlenecks 
J 一 Skew monitor gq 一 Quit 


Licensed Materials 一 Property ot IBM 
Copyright IBM Corp. 2005, 2006 All Rights Reserved. dbztop 2.0 


图 6-1 db2top 初始 界面 


通过 db2top， 可 以 实时 地 查看 DB2 中 的 性 能 瓶颈 。 在 初始 界面 中 输入 选项 “B”， 可 以 看 
到 性 能 瓶颈 相关 的 信息 ， 如 图 6-2 所 示 。 其 中 SessionCpu 行 表明 当前 哪个 应 用 程序 占用 了 最 多 
的 CPU 时 间 ， 而 Memory 行 则 显示 了 哪个 应 用 程序 占用 了 最 大 的 内 存 。 
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| asyne r/w ms 


[1122:47:17,refresh-2secs (0.002) Inactive,member-[1/1],DB2INST1:SAMPLE 
[d-Y,a-N,e-N,np-ALL] [ap-off] 
| | 258 50& 755 1008 
|wait lock ms | 
| sort ms | 
| bn r/w ms | 
| 
| 


|pref wait ms 
| air r/w m3 | 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 


Server lop Resource Resource Application 
Resource Agent Usage Value Name 


=} BSessionCpu 60. 0.291921 


=> IO r/w 557 100.005 29 db2bpn 
一 > Memory 
=> Locks 557 100.005 5 db2bp 
=> Sorts 557 100.005 79 db2bp 
=> Sort Time N/A 0t 0 N/A 
Quit: q, Help: h db2v97.5ample.gicp.com db2top 2.0 


图 6-2 db2top 的 系统 瓶颈 分 析 界 面 


由 于 db2top 显示 结果 随 看 DB2 实际 运行 的 环境 变化 而 更 新 ,有 时 需要 获得 显示 的 内 容 很 困 
难 ， 这 个 时 候 ， 束 可 以 以 后 台 方 式 运 行 而 将 结果 写 入 文件 ， 下 面 的 语句 可 以 以 后 人 台 的 方式 获取 
动态 SQL， 并 将 结果 写 入 文件 top.sql 中 。 其 中 -b 表示 后 台 执 行 ， 而 子 命令 D 表示 动态 SQL, 
-m 参数 指定 以 该 收集 模式 运行 多 少 分 钟 。 

-»$ db2top -d sample -b D -o top.sql -m 5 

DB2 active: 07m:01s 


wWeictcing output to 七 GD sal 


6.4 KIE SQL 语句 监控 


通常 一 个 应 用 中 包含 成 干 上 万 条 SQL， 但 是 影 啊 应 用 性 能 的 往往 是 少数 关键 SOL (Costly 
SQL) ， 这 些 关 键 SQL 也 是 潜在 的 不 良 SQL， 如 果 能 够 快速 地 识别 它们 ， 并 利用 第 9 章 的 SQL 
优化 知识 进行 针对 性 的 优化 ， 往 往 能 够 起 到 事半功倍 的 效果 。 
6.4.1 监控 最 耗费 用 户 CPU 时 间 的 动态 SQL 


通过 下 面 的 租 询 可 以 从 snapdyn_ sql £U EAR [HERE 2t H CPU 时 间 (total usr cpu. time) 最 多 的 
5 条 动态 SQL 语句 ， 对 于 CPU 笨 贷 的 系统 ， 可 以 有 针对 性 地 优化 这 些 SQL: 


select SIMT TEXT 
from sysibmadm.snapdyn sql 
order by total usr cpu time desc 


treten first 5 Cows only 
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STMT TEXT 


select t.tabname, i.indname from syscat.tables t, syscat.indexes i where t.tabname 


= i. täabname anc) COalesce(t. indez tospace, dcl, SUE S) S 


6.4.2 ”监控 访问 热点 对 象 执行 次 数 最 多 的 SQL 


针对 茶 些 IO 财 贷 的 问题 ,需要 找 出 访问 这 些 热点 对 象 的 SQL 语句 进行 调整 ， 从 而 消除 热 
扩 ， 而 热点 对 和 象 包含 热 表 和 热 索 引 。 


当 确 定 某 个 表 例 如 “FLIGHTHISTORY ”为 热 表 时 ， 束 可 以 使 用 下 面 的 语句 从 snapdyn sql 
视图 中 找 出 访问 该 表 执 行 次 数 (num executions) 最 多 的 5 条 语句 及 其 执行 次 数 。 并 从 整体 上 
进行 优化 ， 以 消除 访问 的 热点 : 


select stmt text, num executione 

from sysibmadm.snapdyn_sql 

where stmt text like '$FLIGHTHISTORYS$S' 
order by num executions ON 


reten first 5 rows only 


Saltet ing ee eo 


select ool. “ACTIVERECORD”;, GL- AqEPEORPIOATEGOBYCNU 14644 


使 用 下 面 的 语句 可 以 从 视图 snapdyn sql 查询 访问 索引 页 最 多 的 动态 SQL 语句 ， 其 中 
<TableNameForHotIndex> 为 热 案 引 【〔 被 频繁 访问 的 索引 ) 对 应 的 数据 表 名 : 


select eee snes 

from sysibmadm.snapdyn sql 

where stmt text like '%<TableNameForHotIndex>5' 
order by pool index p reads desc 


fetch first row only 


6.4.3 ”监控 运行 时 间 最 长 的 SQL 


可 以 使 用 下 面 的 查询 从 视图 long running sql 监控 正在 执行 的 运行 时 间 (elapsed time min) 
最 长 SQL 语句 : 

select * 

from sysibmadm.long_running_sql 


order by elapsed_time_min desc 


teteh first cow only 


6.4.4 监控 执行 次 数 最 多 的 SQL 


有 时 候 ， 单 个 SQL 语句 的 执行 时 间 并 不 很 长 ， 但 是 由 于 其 执行 次 数 较 多 ， 也 有 可 能 会 成 为 
RAI, AMAIA] top dynamic sql 中 识别 这 样 的 SQL， 通 过 如 下 人 查询， 可 以 获得 执行 
次 数 最 多 的 5 条 SQL (stmt ext) 及 其 执行 次 数 (num executions) : 
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select stmt text, m executions 
from sysibmadm.top_dynamic_sql 
order by num_executions desc 


treten first 5 rows only 


6.4.5 监控 排序 次 数 最 多 的 SQL 


当 由 于 过 多 的 排序 造成 CPU 使 用 过 高 时 ， 可 以 通过 如 下 查询 ， 从 视图 top dynamic sql 中 
获得 排序 次 数 (stmt sorts) 最 多 的 5 条 SOL 语句 (stmt text) 进行 调整 : 


select stmt Text, STMT SOrTE 
from sysibmadm.top_dynamic_sql 
order by stmt sorts desc 


teten first 5 rows only 


6.5 ”关键 性 能 指标 (KPI) 


现在 感冒 发 烧 很 普遍 ， 医 生 通 常会 要 求 验 血 ， 现 在 的 血 检 报 告 ， 即 使 是 非 专 业 人 士 也 能 简 
蛙 地 阅读 ， 因 为 各 项 指标 的 参考 值 都 会 附 在 检验 结果 后 面 ， 关 键 参数 侯 离 参考 值 束 表示 这 项 结 
果 可 能 会 有 问题 ， 人 体 也 就 可 能 有 这 样 或 者 那样 的 疾病 。 对 于 数据 库 来 说 ， 也 存在 这 样 的 天 键 
性 能 指标 ， 我 们 称 之 为 KPI (Key Performance Indicator) . 


6.5.1 缓冲 区 命中 率 


公式 : CSE TEE /JXx 
指标 : 数据 缓冲 区 命中 率 (Data Bufferpool Hit Ratio) : > 9596 
索引 绥 冲 区 命中 率 CIndex Bufferpool Hit Ratio) : > 9896 
数据 库 中 数据 的 访问 都 震 要 经 过 绥 冲 池 : 读 的 数据 需要 先 读 a 到 绥 冲 池 才 能 提交 给 应 用 ， 写 
的 数据 也 要 先 写 到 绥 冲 池 才 能 进行 VO. VO 操作 作为 数据 库 中 最 慢 的 环节 ， 对 数据 库 性 能 起 寿 
至 关 和 曹 要 有 的 有 影响， 如 果 数 据 能 够 直接 从 缓冲 区 中 获取 ， 将 大 大 减少 IO 操作 。 绥 剖 池 命中 率 可 
以 从 管理 视 网 中 方便 地 获取 ， 从 下 面 的 结 末 来 看 ， 绥 冲 池 BPBCPI003 和 BPBCPI004 数据 绥 冲 
区 命中 率 偏 低 ， 需 要 进一步 分 析 ， 对 于 命中 率 为 寒 的 绥 冲 池 通 党 是 因为 没有 使 用 到 ， 这 个 时 候 
束 需 要 进一步 分 析 是 否 需 保存 该 绥 冲 池 。 


db2 "SELECT SUBSTR(BP NAME,0,15) AS BP NAME,TOTAL HIT RATIO PERCENT || '$' AS 
TOTAL HIT RATIO,DATA HIT RATIO PERCENT || '$' AS DATA HIT RATIO, INDEX HIT RATIO PERCENT 
|| '$' AS INDEX HIT RATIO FROM SYSIBMADM.BP HITRATIO WHERE BP NAME NOT LIKE 'IBMSYS$'" 


BP NAME TOTAL HIT RATIO DATA HIT RATIO INDEX HIT RATIO 
IBMDEFAULTBP 99.98 99.99 99.87 
BPBCPDO001 0.00 0.00 - 
BPBCPDO002 E SITQUE - 
EXE 99.99 99-99 = 
BPBCPD004 99.99 99.99 99.91 


225 


DB2 设计 、 管 理 与 性 能 优化 艺术 


Be ol ©. 00 0.00 = 
DEBCPITUZ 99-96 99a 5 99 9G 
BPBCPI003 99.99 69.74 EO 
BPBCPIOOA 99.99 40.98 SO YY 
BEBCPDEPT 0.00 0.00 = 


6.5.2 包 缓 冲 区 命中 率 


公式 : 1 一 包 缓 剖 区 插入 次 数 / BLZ TP PX A CR 

指标 : 包 绥 冲 区 命中 率 CPackage Cache Hit Ratio) : >98% 

当 数 据 库 引擎 接收 一 条 玛 询 请 求 的 时 候 ， 首 先 会 从 包 绥 冲 中 三 找 有 没有 已 经 被 编 详 好 的 包 
可 以 直接 运行 ， 如果 但 询 到 已 经 存在 ， 束 可 以 直接 运行 而 不 用 再 次 编译 从 而 市 省 SQL 语句 编译 
的 时 间 。 通 党 在 编写 应 用 的 时 候 应 该 使 用 绑 定 变量 ， 这 样 能 够 提 高 包 绥 冲 区 的 命中 率 。 下 面 的 
运行 结果 显示 包 绥 冲 区 命中 率 96.88% 低 于 98%, 这 时 就 需要 进一步 分 析 原 因 ， 是 由 于 缓冲 池 不 
足 还 是 由 于 应 用 中 过 多 的 得 询 没 有 使 用 绑 定 变量 碍 询 造 成 的 命中 率 偶 低 ， 如 果 是 前 者 ， 可 以 参 
考 第 7 草 来 调整 数据 库 参 数 ， 如 末 是 后 者 ， 可 以 参考 第 9 革 来 调整 SQL 语句 。 


加 
NUMERIC (52) J|] "%" AS PACKAGE HIT RATIO FROM SYSIBMADM. ND 


PACKAGE HIT RATIO 


6.5.8 编目 缓冲 区 命中 率 


公式 : 1 一 编目 缓冲 区 插入 次 数 /编目 缓冲 区 但 询 次 数 

指标 : 编目 绥 冲 区 命中 率 (Catalog Cache Hit Ratio) : >98% 

编 日 信息 也 就 是 数据 库 本 映 的 元 信息 ， 儿 平 每 一 个 数据 库 操作 都 需要 侍 询 编 日 表 ， 因 此 
DB2 单独 开 尽 了 一 块 内 存 空间 ， 用 于 存储 编 日 信息 ， 如 果 编 日 缓冲 过 小 ， 那 么 每 次 想 要 但 找 编 
目 数 据 时 ， 就 要 从 编目 表 空 间 中 会 找 ， 这 样 会 叶 任 系统 性 能 下 降 。 因 些 一 般 需 要 将 
catalogcache sz 设置 到 合适 的 值 ， 使 编 日 缓冲 区 命中 率 保 持 在 98% 以 上 。 通 过 执行 下 和 面 的 但 询 
语句 ， 束 可 以 得 到 编目 缓冲 区 的 命中 率 ， 从 当前 的 执行 结果 可 以 得 出 当前 数据 库 的 编目 缓冲 区 
命中 率 为 98.53%， 是 达到 要 求 的 。 


dla "SERHBRODOOASTOCQUCATOSCRCOHECINSERTS/DOUBLE(CATOGCACHE LOORUPS))SSTOQOUAS 
NUMERIC (52) JI] "%' AS CATALOG HIT RATIO FROM SYSIBMADM- ND 


CATALOG HIT RATIO 


6.5.4 缓冲 区 读 与 平均 啊 应 时 间 

公式 ， 缓冲 区 读 取 或 写 入 时 间 / 物 理 读 取 或 写 入 次 数 

指标 ， 平均 读 写 时 间 : < 5 ms 

该 指标 反映 LO 的 性 能 ， 如 果 监控 的 结果 值 超出 了 指标 ， 就 需要 结合 操作 系统 VO 监控 工 
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具 来 作 进一步 分 机 ， 通 过 执行 下 面 的 得 询 ， 可 以 得 出 当前 系统 的 缓冲 区 读 写 的 平均 啊 应 时 间 是 
满足 性 能 要 求 的 : 


gio “SELECT RBP NAME, AVERAGE READ TIME MS, AVERAGE WRITE TIME MS FROM 


SS ILE DIESE D READ IO AS R; SYSIBMADM BP WRITE IO AS W WHERE 
Ro SNAPSHOT TIMES TAMP=W.- SNAPSHOT TIMESTAMP AND Ro BP NAME=W. BP NAME AND R-BP NAME NOT LIKE 


freu n 
BP NAME AVERAGE READ TIME MS AVERAGE WRITE TIME MS 
IBMDEFAULTBP 1 0 
BPBCPD001 0 - 
BPBCPD002 0 0 
BPBCPD003 4 0 
BPBCPD004 0 
BPBCPI001 0 - 


65.5 日 志 写 入 速度 


公式 : 日 志 写 入 时 间 / 日 志 写 次 数 

指标 : < 3ms 

对 于 OLTP 系统 来 说 ,日 忘 的 写 入 速度 对 应 用 程序 的 性 能 有 着 决定 性 的 影响 。 通 过 下 面 的 
查询 ， 可 以 得 到 当前 的 日 志 写 入 速度 为 0.1437ms， 因 此 是 达到 要 求 的 : 


db2 "SELECT (LOG WRITE TIME NS/1000000)/NUM LOG WRITE IO AS AVERAGE LOG WRITE MS 


FROM SYSIBMADM.SNAPDB" 


AVERAGE LOG WRITE MS 


6.5.6 $7 £k & 7b svi 


指标 : (Lock Escalations and Deadlocks) : 仪 有 少量 的 锁 升 级 或 死 锁 

锁 升 级 或 者 死 锁 会 极 大 地 影 啊 系 统 的 并 发 性 能 ， 因 此 应 该 将 LOCKLIST 和 MAXLOCK 参 
数 调整 到 足够 大 ， 尽 量 避 免 锁 等 待 、 锁 升级 ， 并 调整 应 用 避免 死 锁 的 有 发生， 从 而 使 数据 库 的 并 
发 性 达到 最 大 。 从 下 面 的 结果 可 以 看 出 系统 发 生 了 1311 RIEM, 所 以 需要 通过 使 用 死 锁 监控 右 
来 进一步 分 析 死 锁 的 原因 。 


Glle “SELECT LOCK ESCALS, DEADLOCKS FROM SYSITBMADM.- SNAPDB™ 


LOGK SCALS DEADLOCKS 


6.5.7 ”排序 洪 出 率 


公式 : 排序 洲 出 次 数 / 总 排序 次 数 
指标 : (Sort Overflow / Total Sort) : <1% 
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排序 海 出 就 是 当 排 序 内 存 不 够 时 ， 数 据 需要 使 用 临时 表 空 间 进行 排序 。 因 此 排序 溢出 时 会 
产生 大 量 IO 操作 ， 从 而 影响 SQL 语句 的 执行 性 能 。 通 过 下 面 的 得 询 ， 可 以 看 到 当前 系统 的 排 
Frist tH EJ 7.8396, 超出 指标 很 多 , 这 个 时 候 , 融 需 要 分 析 是 由 于 排序 堆 内 存 不 足 还 是 由 于 SQL 
语句 不 佳 造成 的 ， 进 而 分 别 采 取 指 施 : 


db2 "SELECT CONCAT(CHAR(CAST((SORT OVERFLOWS/DOUBLE(TOTAL SORT TIME))*100 AS 
NUMERMGCTADDP EMOMSORIEOUSERBEONWEBRIITOOHBSOMOSYSIEBMADMOSNAPIDE? 


SORT OVERFLOW RATIO 


6.5.8 数据、 索引 页 异步 清除 比例 


公式 : 异步 号 入 /总 写 入 

指标 : (Async Writes/Total Writes) : > 9594 

该 指标 代表 首页 面 清除 进程 〈 线 程 ) 是 否 能 够 有 效 地 将 及 页 在 后 台 写 入 倒 盘 。 当 该 请 除 进 
程 一 直 处 于 空间 状态 或 者 由 于 绥 冲 池 大 小 不 合适 ， 造 成 db2 无 法 找到 一 个 干净 的 页 耐 ， 束 会 友 
生 同 步 号 入 ， 相 对 于 天 步 号 入 ， 同 步 写 入 会 对 数据 恋 取 性 能 造成 问题 。 通 过 以 下 语句 得 询 可 以 
看 出 当前 系统 的 异步 清除 比例 是 否 合格 : 


clo2 “SELECT SUBSTR(BP NAME, 0,15) AS BP NAME, PERCENT WRITES ASYNC FROM 
SYSIBMADM BP WRITE IO WiiaRa BP NAME NOT LIKE "LBMSYS% 


BP NAME PERCENT WRITES ASYNC 
IBMDEFAULTBP 97 
BPBCPD001 96 
[SEE EP 98 


6.5.9 Bit va fy E EN 


公式 : 脏 页 偷 取 触发 次 数 

指标 : 脏 页 偷 取 次 数 (Dirty page steal cleaner triggers) 非常 低 

脏 页 偷 取 过 多 则 意味 看 页 清除 器 的 工作 能 力 不 足 ， 需 要 调整 页 清除 器 相关 的 设置 ， 如 果 系 
统 中 页 清除 器 一 直 很 空闲 ， 则 可 以 通过 调节 softmax 与 chngps thres 来 让 其 更 频繁 地 工作 ， 但 
是 如 和 果 页 清除 器 一 直 非 党 崇 忙 ， 则 需要 增加 页 清除 喜 的 数量 ， 页 清除 器 的 初始 数量 通 音 与 CPU 
的 数量 相同 。 使 用 如 下 得 询 , 可 以 看 出 当前 系统 由 于 页 清除 亏 的 工作 能 力 不 足 , 从 而 发 生 了 2216 
次 的 脏 面 偷 取 ， 因 些 和 需要 增加 页 清除 器 的 数目 : 


db2 "SELECT POOL DRTY PG STEAL CLNS FROM SYSIBMADM.SNAPDB WHERE 
POOL DRTY PG STEAL CLNS»0" 


POOL DRTY PG STEAL CLNS 
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6.6 ”融会 贯通 一 一 监控 的 最 佳 实 践 


通过 上 面 章节 的 学 习 ， 相信 您 已 经 掌握 了 DB2 监控 工具 的 使 用 , 也 就 是 掌握 战争 中 武器 的 
使 用 方法 ， 但 是 如 果 不 学 习 战 略 战术 ， 还 十 难以 取得 战争 的 胜利 。 对 于 监控 来 讲 ， 分 为 第 规 监 
控 和 对 于 特定 问题 的 监控 ， 本 章 主 要 关注 性 能 问题 的 监控 。 

性 能 问题 往往 分 为 两 大 关 : 影 啊 整 个 系统 的 问题 和 只 影响 部 分 系统 的 问题 。 但 是 它们 的 界 
限 通 向 不 是 那么 明显 ,例如 特定 应 用 或 不 展 的 SQL 语句 通常 只 会 影 啊 部 分 系统 , 但 是 有 时 这 些 
特定 应 用 造成 了 系统 的 瓶颈 ， 就 会 影响 整个 系统 。 

第 1 革 提 到 了 5 PrE LAA, P AAE 6.2.4 贡 已 经 详细 讲述 过 了 ， 下 面 重点 讲 
述 CPU. Wk. Vf. WU REA 种 瓶颈 的 监控 和 诊断 方法 。 


6.6.1 CPU 瓶颈 问题 的 监控 与 诊断 


CPU 眶 琉 表 现在 两 个 方面 : 

CI) 所 有 CPU 都 饱和 意味 大 这 个 系统 上 的 所 有 处 理 喜 都 崇 忙 。 根 据 vmstat 和 perfmon 的 
报告 ， 一 般 的 标准 是 计算 用 户 CPU 时 间 和 系统 CPU 时 间 。CPU 利用 率 如 果 长 时 间 都 超过 95% 
束 被 认为 是 饱和 的 。 

(2) 单 CPU 饱和 意味 痢 在 一 个 处 理 器 上 的 负载 达到 了 饱和 ， 但 是 其 他 处 理 器 却 部 分 或 完 
AUR. BRAA HI HS CPU 能 力 ， 系统 却 无 法 消费 ， 因 此 ， 应 用 程序 或 语句 的 速度 取决 于 这 
一 个 处 理 器 内 核 的 繁忙 程度 。 

同样 也 应 该 考虑 到 用 户 模式 和 系统 模式 上 不 同 的 CPU 消耗 ,一 种 是 处 理 器 正在 运行 操作 系 
统 内 核 以 外 的 软件 ， 比 如 DB2 应 用 程序 或 者 中 间 件 ， 导 致 用 户 CPU 时 间 增 多 。 另 一 种 是 在 运 
行 操作 系统 内 核 的 时 候 系统 CPU 增多 。 这 两 个 在 数量 上 是 分 开 显示 的 ,并 且 根 据 它 们 之 间 的 分 
布 情况 , 可 以 有 助 于 找到 导致 CPU 瓶 贷 的 原因 。 用 户 和 系统 CPU 时 间 比 率 在 3:1 到 4:1 之 间 是 
正常 的 。 如 果 在 有 瓶颈 的 系统 中 ,用户 和 系统 时 间 比 率 高 于 这 个 区 间 ， 台 需 要 调查 用 户 CPU 时 
间 为 什么 会 增加 了 。 

使 用 db2pd -edus MS, M USR 和 SYS 列 可 以 看 到 每 个 DB2 代理 程序 耗费 的 用 户 和 系统 
CPU 时 间 ， 单 位 为 秒 : 


DopumueceMemsec E ccm coe cS ud Incem» uo» qos EO o 


List of all EDUs for database member 0 


dlo2syse PIDs 42720 
db2wdog PID: 42718 
Go ECG PIDs 42739 


EDU ID TID Kernel TID EDU Name USRS oro S) 
5105 1398540843843 cdoz2agntcio (DB2V102 ) Q 0.830000 0.750000 
304 1398571243842 eoo ade olor (DB2V102 ) Q 1.770000 1.730000 
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302 1398532043840 db2agent 
303 1398501643841 db2agntdp 
301 1398562443839 db2agntdp 
298 1398553643836 db2agent 


当 发 现 用 户 CPU 时 间 比 例 过 高 时 ， 残 需要 分 


(DB2V102) 0 3.650000 5.650000 
(DB2V102 ) 0 2.160000 3.420000 
(DB2V102 )》 0( 0.170000 0.190000 

(DB2V102) 0 2.910000 5.110000 


析 占 用 CPU 过 高 的 SQL 语句 或 者 应 用 程序 。 


通过 使 用 应 用 程序 快照 ， 或 查询 sysibmadm.snapappl 管理 视图 来 找 出 什么 应 用 程序 消耗 了 大 多 
数 CPU 时 间 ， 从 下 面 的 得 询 结果 看 出 ， 主 要 是 应 用 程序 消耗 了 用 户 CPU: 


select pide pm MET SET cH 


agent usr cpu time s -* agent usr cpu time ms / 1000000.0 as user cpu 


from sysibmadm.snapappl appl, 
s$sysibmacm,. snapappl into appl infe 

where appl. agent ic = 
appl. cdopartitionnum = 


order by user cpu desc 


DBPARTITIONNUM APPL NAME 


0 db2jcc_application 
0 db2jcc_application 
0 db2jcc_application 


Spotlight.exe 
db2jcc_application 
db2stmm 
db2jcc_application 
db2bp.exe 
CueSsE O REIN 7 Ds 


appl into agent ic anc 
appl into ,cdopartitionnum 


USER CPU 


3010.51562500000 
2699.07812500000 
2216.73437500000 
204 .109375300000 
174,.28125000000 
34.04687500000 
11.29687500000 
3- 71875000000 
0.15625000000 


同样 ， 通 过 动态 语句 快照 ， 或 查询 sysibmadm.snapdyn sql 管理 视图 ， 可 以 确定 哪些 SQL 
语句 正在 占用 绝 大 多 数 CPU 时 间 : 


select substr CE as sql tCext, 
total usr cpu time + 

tots ws cou Cine me / I00900UO0.Q9 se veeri oon 
from sysibmadm.snapdyn sql 


order by user cpu desc 


Sc cod user cpu 

select ql." ACTIVERECORD",;, Q1., "AIRPORTCATEGORYCAP™ 14644.09375000000 
selecte gaol. "ACTIVERECORD”, G1," SCHEDULEDAIRLINE", € 10712 .260562500000 
selecte ql.“ ACTIVERECORD", ec "ARRIVALAIRPORT™; Gl. 4304.67187500000 
selecte ql." ACTIVERECORD™", @1,"ARRIVALAIRPORT™;, Gl. 3618.21875000000 


利用 下 面 的 查询 ， 可 以 查 出 占用 CPU 最 高 的 前 10 个 动态 SQL 语句 : 


SELECT MEMBER, 


SECTION TYPE, yarchar(stme text, nn em eals 
TOTAL CPU TIME/NUM EXEC WITH METRICS as 


AVG CPU TIME, TOTAL CPU TIME 


numExec, 
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FROM TABLE (MON GET PKG CACHE STMT “D', NULL, NULL, =2)) as T 
oae esten T o NUM EEC WETE METRICS <> 0 

ORDER BY AVG CPU TIME dese 

FETCH FIRST 10 ROWS ONLY}? 


MEMBER SECTION TYPE STATEMENT NUMEXEC AVG CPU TIME TOTAL CPU TIME 
0 D SELECT MEMBER, SECTION... 2 26524 53048 
0 D select * from syscat.tab.. 33 26200.5315 964617 
U D select * from act.. 34 97.1470568 3303 


同时 ， 还 应 该 考虑 静态 SQL 语句 。 快 照 监控 器 并 没有 包含 静态 SQL 语句 的 信息 。 所 以 需要 使 
用 语句 事件 监控 器 , 或 者 WLM 活动 事件 监控 器 , 来 收集 它们 的 系统 CPU 和 用 户 CPU 的 使 用 信息 。 
可 以 用 LIST APPLICATIONS 命令 得 到 关注 的 应 用 程序 ID (例如 LOCAL.DB2.075D83033106) ， 
然后 使 用 下 面 的 语句 定义 监视 器 : 


Create event monitor stmt eyt ftor statements 
where appl id = '*LOCAL.DB2.075D83033106' 

write tO table 

connheader (table stmt evt ch, in tbs evmon) , 
stmt (table stmt evt stmt, in tbs evmon, trunc), 
Cox ESO we ere e e e CEUOU EIOS) COSTUOY QU) 


burfrersize 512 


SEPA ER AEM RRES XX T CPU 受 限 的 环境 中 ， 用 户 CPU 是 决定 
因素 ， 如 采 发 现 系统 CPU 时 间 过 高 ， 则 需要 簿 看 DB2 线程 在 操作 系统 中 的 上 下 文 切换 率 。 在 
Unix 系统 中 ， 上 下 文 切换 在 vmstat 中 在 “CS” 列 有 记录 。 每 秒 超过 75000-100000 次 的 上 下 文 
切换 速度 说 明 切 换 率 过 高 。 这 时 要 减少 用 户 连接 数 或 者 DB2 代理 程序 数 。 


=> vmstat 


r b swpd free buff cache si SO bi bo LN cessus CS 


0 0 5488 550396 95596 872224 0 0 2 T3 S6 2l2 0 1 99 0 Q 


6.6.2 l/O 瓶 须 的 监控 与 诊断 
当 使 用 IOSTAT 或 者 TOPAS 等 系统 命令 发 现 菜 个 人 磁盘 特别 繁忙 时 (繁忙 程度 超过 80%) ， 
则 说 明 存 在 磁盘 瓶 贷 。 确 定 存 在 瓶 颁 的 人 磁盘 在 系统 中 的 路 径 后 ， 可 以 利用 下 面 的 查询 得 到 哪个 
表 空 间 用 到 了 这 个 侯 檀 : 


select substr (tosp nane,l,25) tosp name, tosp ic, substr (container name,1,350) 


Container name 
from sysibmadm.snapcontainer 


where container name like "F:% 


TBSP NAME TBSP ID CONTAINER NAME 

TSBCPDO002 A Fs \dob2data\TSBCEDO0O2C0OOL -DAT 
TSBCPD002 A Fg \cdo2cdaca\TSBCPD002C002 DAT 
TSBCPD002 4 Fg \cdo2cdeata\TSBCPD002C003. DAT 
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当 得 到 表 衬 间 的 名 字 TSBCPD002 和 标号 4 后 ， 根 据 表 空间 的 属性 ， 有 以 下 的 分 析 方 法 。 
d) 如 果 这 个 表 容 间 是 用 于 存放 表 数 据 的 ， 则 通过 下 面 的 查询 可 以 得 到 这 个 表 空 间 中 所 
有 表 的 行 读 写 次 数 ， 人 确定 “ 热 表 ”: 


SELECT TABLE NAME, ROWS READ, ROW WRITTEN 


FROM sysibmadm.snaptab 
WHERE TABLE NAME IN (SELECT TABNAME FROM SYSCAT.TABLES WHERE 
TBSPACEID=4) 


TABNAME ROWS READ ROWS WRITTEN 
DATAINTEGRITYARCHIVE 4] 94 
DATAINTEGRITYMESSAGE 445132850 807779 
ELTCHTDETATE 5696899 A229062 
ATREO EDS BEN 84936644 250261 
ARCHIVEDINPUT 9701900 1844624 
CHARGE 8884354 9390068 
DETERMINEDSERVICE 12050486 9907543 
FLIGHTDATA 12442784 1594678 
FLIGHTDETAILHISTORY 2262230518 1273347 
INVOICELINEITEM 9293936 2593130 
MATCHRESULT 2592199 664003 


使 用 下 面 的 查询 可 以 查 出 所 有 涉及 到 “ 热 表 ”FLIGHTDETAILHISTORY 的 动态 SQL 
语句 : 
SELECT substr (STMT TEXT, 1,50) as STMT TEXT, ROWS READ trom sysibmacm.snapayn sgl 


WHERE Translarce (cast (substr (stmt text, 1,50) as varchar (55) )) 
like “EMPLOYEE” order 5v ROWS READ 


STMT TEXT ROWS READ 


SELECT * FROM FLIGHTDETAILHISTORY WHERE 4... 1262230518 


上 面 的 查询 返回 表 的 行 读 写 次 数 (ROWS READ. ROWS WRITTEN) 、 执 行 时 间 、 执 行 
次 数 (NUM EXECUTIONS) 、CPU 时 间 等 等 。 使 用 ROWS READ、ROWS WRITTEN 和 
NUM EXECUTIONS 对 结果 进行 排序 ， 找 出 最 活跃 的 SQL 语句 。 

除了 动态 语句 ， 如果 要 判断 是 否 是 静态 SQL 语句 造成 了 瓶 贷 ,可 以 使 用 下 面 的 语句 找 出 所 
有 访问 热 表 FLIGHTDETAILHISTORY 的 静态 SQL: 


select PKGSCHEMA, PKGNAME, SECTNO, substr (TEXT,1,80) 
from syscat.statements 
were mesmelbsse (cset Csmoetue (Ebesxc.l.526)2) 
as varchar (32672) ) ) like ` $FLIGHTDETAILHISTORYS ' 


PKGSCHEMA | PKGNAME SECTNO 4 

NULLID  P1418126958 1 SELECT ARRAY AGG(AI1.LOCK WAIT START TIME), ARRAY AGG(A 
NULLID  P1418126958 74 SELECT ARRAY AGG(AI. AGENT TID), ARRAY AGG(AI.REQUEST T 
NULLID  P1418126958 85 SELECT ARRAY AGG(AI.ACTIVITY ID), ARRAY AGG(AI.UOW ID) 
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NULLID  P966173830 26 SELECT ARRAY AGG (A. ACTIVITY ID ORDER BY (A.CPU RANK + 


然后 可 以 使 用 db2pd -static 来 找 出 它们 当中 哪些 是 高 度 活跃 的 。db2pd -static 的 输出 中 ， 
NumRef 列 显 示 这 条 语句 已 经 运行 了 多 少 次 , UseCount 列 显 示 了 当前 有 多 少 DB2 代理 程序 正在 


运行 这 条 语句 ， 找 出 NumRef 次 数 最 高 行 对 应 的 PkgName 值 (P1418126958 ) 和 SecNo fB(1),. wè 
可 以 从 上 面 的 结束 中 和 三 询 到 该 SQL 语句 : 


Sections : 

Address Schema PkgName UniqueID SecNo NumRef UseCount 
0x00007FBB449F72E0 NULLID  JP1418126958 1 1662 0 
0x00007FBB449F7530 NULLID P1418126958 2 0 0 
0x00007FBB449F7780 NULLID P1418126956 > 831 1 
0x00007FBB449F79D0 NULLID P1418126956 4 0 0 
0x00007FBB449F7C20 NULLID P1418126956 5 830 0 
0x00007FBB449F7E70 NULLID P1418126956 6 0 0 
0cce0 00 0 7 EFBBAAOESOCO NULLID P1418126956 7 831 1 
OxO00007EFBBA49F8310 NULLID P14181269568 8 0 0 
0x00007FBB449F8560 NULLID B14A418126958 9 830 0 
0x00007FBB449F87B0 NULLID P1418126958 IRO 830 0 
0x00007FBB449F8A00 NULLID P1418126956 O) 0 


(25 如 果 这 个 表 衬 间 是 一 个 索引 表 衬 间 ， 需 要 检 奏 表 衬 间 中 是 否 有 活跃 的 索引 读 写 ， 如 
下 和 面 的 表 空 间 TSBCPD003 中 有 大 量 的 索引 该 (POOL_INDEX_P_READS): 


Se 
pool index p reads, pool index writes 

from sysibmadm.snaptbsp T 

where T.,tosp id = 5 


DBPARTITIONNUM TBSP ID TBSP NAME POOL INDEX P READS POOL INDEX WRITES 


0 5 TSBCBPBD003 262230518 0 


接着 查看 表 空 间 TSBCPD003 中 有 哪些 索引 及 使 用 该 索引 的 表 : 


select t.tabname, i.indname 


from syscat.tables t, syscat.indexes i 


where t.tabname = i.tabname and 

Coal se (I< Pe TSBCPDOO0S 
TABNAME INDNAME 
ELLGHATDELTALLALSTORY $50L12102318035300770 
PLIGHTDETALLHEILSTORY S$0L121023180500860 
PLIGHTDETALLHEILSTORY $0L121023180300870 


然后 伍 看 其 中 哪些 索引 是 高 度 活跃 的 。 如 末 在 检查 的 表 空 间 中 有 不 止 一 个 索引 ， 束 需要 查 
看 索引 层面 的 活跃 程度 。 反 复 运 行 命令 db2pd-db <dbname>-tcbstats index。 其 中 “TCB index 
Stats” 列 显示 了 所 有 活动 的 索引 ， 以 及 每 一 个 的 统计 信息 。“Scans” 列 显示 了 在 每 个 索引 上 已 
经 执行 了 多 少 次 索引 扫 摘 。 
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cdlo2pel OI FLIGHTDB elsi index 
Database Memoer 0 ==- Database FLIGHTDB == Active =-=- Up 17 days 00:11:46 == 


TCB Index Stats: 


Address TableName Scans IxOnlyScns KeyUpdates 
0x00007F9DFSF56A60 SYSTABLES 58 58 0 
0x00007F9DFSF56A60 SYSTABLES 0 0 0 
OxO00O007EFODEFS3EFS56A60 SYSTABLES 0 0 0 
0x00007F9DFSF56A60 SYSTABLES 0 0 0 
0x00007F9DF3F56A60 SYSTABLES 0 0 0 
0x00007F9DF3F759E0 FLIGHTDETAILHISTORY 129700 1600 0 


(3) 如 果 这 个 表 空 间 是 临时 表 空 间 ， 下 面 的 查询 可 以 查 出 这 个 临时 表 空 间 的 WO 繁忙 是 否 
由 于 排序 溢出 (SORT_OVERFLOWS) 导 致 的 : 


select dopartitcionnum, TOTal sorts, 
total sort time, SOrt Overflows 


from sysibmadm.snapdb 


DBPARTITIONNUM TOTAL SORTS TOTAL SORT TIME SORT OVERFLOWS 


0 10638459 2850366 222797 


REEL e AW AAA P R A E S Hou. MAAE UO 是 个 由 于 过 多 的 中 间 
AUR AT A: 
ee pota DIUTIUS ibep name, 
pool temo data p reads, pool data writes 


from sysibmadm.snaptbsp 


where tbsp id = 3 


DBPARTITIONNUM TBSP NAME POOL TEMP DATA P READS POOL DATA WRITES 


0 TEMPSPACEI 0 75866 


6.6.3 A F#LIAI iata 5 i h 


DB2 的 内 存 问 题 分 为 物理 内 存 限 制 和 内 存 的 分 配 问 题 ， 现 实 中 ， 通 第 物理 内 存 是 序 足 的 ， 
但 是 有 时 候 也 会 表现 为 内 存 不 足 ， 这 是 因为 默认 参数 的 情况 下 ， 分 配给 DB2 使 用 的 内 存 太 小 造 
成 的 ， 所 以 对 于 只 安装 DB2 的 系统 来 说 ， 通 第 应 该 将 60% 以 上 的 内 存 分 配给 DB2。 另 一 个 问 
题 是 内 存在 DB2 内 部 不 同 组 件 的 分 配 ， 自 从 DB2 V9 引入 强大 的 STMM 机 制 之 后 ，DBA 对 于 
内 存 管理 的 工作 大 大 减轻 了 。 但 是 正确 分 配 充足 的 内 存 仍 然 是 民 好 性 能 的 关键 ， 而 且 一 个 内 存 
版 领 经 党 能 够 把 目 己 伪装 成 磁盘 或 CPU 问题 ， 所 以 在 发 现 磁 盘 或 者 CPU 问题 的 时 候 通 音 需要 
进一步 分 析 ， 以 找到 真正 的 罪魁 祸首 。 表 6-10 列 出 了 常见 的 内 存 瓶颈 ， 但 却 表现 为 磁盘 或 者 
CPU 的 问题 。 
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表 6-10 内存 问题 导致 的 磁盘 CPU 问题 


内 存 问 题 证 状 
绥 冲 太 小 或 者 整个 系统 内 存 太 小 数据 或 者 索引 表 笃 间 的 磁盘 瓶 信 
Sortheap/sheapthres shr 大 小 临时 表 空 间 人 磁盘 租 俩 
日 志 绥 冲 太 小 H s RÀ XR 91 
T f X DEP I 重复 包 绥 剖 插 入 造成 的 CPU EC 


系统 内 存 过 度 分 配 或 者 使 用 较 小 的 内 存 | 过 多 的 系统 CPU 时 间 人 花费 在 虚拟 内 存 管 理 (VMM) 上 
页 大 小 礼 理 很 大 的 系统 内 存 


当 出 现 CPU 或 者 磁盘 问题 的 时 候 , 需要 查看 数据 库 、 实 例 和 应 用 的 内 存 使 用 状态 ， 以 确定 
是 否 由 于 内 存 的 原因 导致 。 这 可 以 通过 快照 、 管 理 视图 或 者 db2pd KEF. 

下 面 介 绍 如 何 使 用 db2pd 命令 进行 租 看 ， 使 用 下 面 的 命令 可 以 从 Size 和 Used ZI t is 
库 分 配 和 使 用 的 总 内 存 : 


[db2inst1@db2 ~] $db2pd -memsets -db FLTGHTDB 


Daira babe meari na aS eE a CE TO EOE 


KEMONDO CIE: 


Name ... Id Size (Kb) ... Used (Kb) Cmt (Kb) Uneme (Ko) 
FLIGHTDB 0 57905792 35188480 35851392 128 
App265 0 0 0 0 0 

App1348 0 0 0 0 0 

App701 104690 128 128 128 0 


使 用 下 面 的 命令 可 以 得 看 各 种 堆 使 用 的 实际 内 存 ， 通 过 分 析 请 求 内 存 的 大 小 与 实际 分 配 的 
物理 内 存 情 况 来 确定 古 否 存在 内 存 问题 以 及 存在 内 存 问 题 的 组 件 ， 然 后 结合 第 7 章 的 参数 调整 
来 调整 数据 库 参 数 ， 将 数据 库 内 存 分 配 到 最 佳 状态 。 


[do2instlG8db2 -—-]$db2pd -mempools -db FLIGHTDB 


Database Partition 0 == Database FLIGHTDB == Active == Up 2 days 23336310 


Memory Pools: 


. MemSet PoolName Iel ooo LOGSZ c SENS S PhyHWM ... CfgParm 
HMICEINDE utiln 5 4928 458752 524288 UTIL HEAP SZ 
FLIGHTDB pckcacheh 7 39145186 42074112 51642368 PCKCACHESZ 
FLIGHTDB xmlcacheh 93 149656 196608 196608 n/a 
PLIGAHTDB catcachen & 1036888 13760256 1441792 CATALOGCACHE SZ 
ELIGHTDB bph 16 1070633344 1071185920 10711685920 n/a 
FLIGHTDB bph 16 1070633344 1071185920 1071165920 n/a 
FLIGHTDB bph 16 1070633344 1071185920 1071185920 n/a 
FLIGHTDB bph 16 1070633344 1071185920 1071185920 n/a 


使 用 下 和 面 的 命令 可 以 伍 看 缓冲 池 状 态 ， 得 到 远 辑 谈 、 物 理 读 以 及 命中 紊 等 信息 ， 结 合 前 面 
所 讲解 的 KPI 殉 能 够 确认 是 个 存在 由 于 组 神 凶 僻 成 的 内 存 眶 倾 : 
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[db253nstldb2 —]5db2pd -bufferpools -db FLIGHTDB 


Database Partition 0 == Database CASMS == Active == Up 2 days 23:36:29 
Bufferpools: 

First ACGtivye POOL ID 1 

Max Bufferpool ID 11 


Max Bufferpool ID on Disk 11 
Num Bufferpools 15 


Bufrerpool btatistics for all butfferpools (when BUFFERPOOL monitor switch is ON) < 


BPID DatLRds DatPRds HitRatio ... HitRatio ... HitRatio TmpIdxLRds HitRatio 
1 492071 758 99.85% 100.00% 99.883 0 00.003 

2 34 34 00.00% 00.00% 00.00% 0 00.003 

3 2584949464 75174005 97.09% 00.003 00.00% 0 00.003% 

4 234174401 5730 100 DES 00.00% 00.00$ 0 00.003 

5 16597275 462 100.00% 00.00% 99.923 0 00.003% 


6.6.4 ”懒惰 系统 的 监控 与 诊断 
有 一 种 性 能 问题 尽管 没有 明显 的 磁盘 瓶颈 、 内 存 瓶 诺 、CPU 瓶颈 或 网 络 瓶颈 ， 但 是 系统 的 


响应 就 是 出 奇 的 慢 ， 这 就 是 通常 所 说 的 懒惰 系统 。 懒 惰 系 统 通 常 和 锁 相 关 ， 包 括 锁 等 待 、 锁 升 


级 、 
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死 锁 和 锁 超 时 。 
可 以 通过 下 面 命令 确定 系统 是 否 存 在 严重 的 锁 等 符 。 


select snap- appl _ name, snap- primary auth icl, 
P lock narte ape ecce pe 


from sysibmadm.snapappl info snap,sysibmadm.snapappl ap 


where snap agent ic = ap agent id anc ap. lock waits > 0 

APPL NAME PRIMARY AUTH LD LOCK _ WAITS LOCK WAIT TIME 

clo Jee application DB2ADMIN 2:67 322325 
02JEE application DB2ADMIN 261 158276 
lle ele application DB2ADMIN 388 393523 
clo2Jce application DB2ADMIN 512 441493 
dios Jee application DB2ADMIN 521 932213 
02JEE application DB2ADMIN 954 139977 
clo2 Jee application DB2ADMIN 1169 842721 


A xu PAR EARR REMAR PUBUONUBUGESINI, XS AR 1000 笔 事 务 发 生死 锁 超 过 一 
MEARE I8] o 


select snap- -appl _ name, snap- primary auth icl, 


ap- Locks _ neld, ap -lock escals, ap lock timeouts, 
ap- deadlocks, ap -int deadlock rollbacks 


trom sysibmecm.snapappl into snap, mm 


第 6 章 系统 u f/f 


where snap- agent ic = ap agent ic 


APPL NAME = — = oooooo LOCKS HELD LOCK_ESCALS LOCK TIMEOUTS DEADLOCKS 
INT DEADLOCK ROLLBACKS 


02JEE application 0 0 0 42 24 
02JEE application 0 0 0 59 Pes 
clo2Jce application 0 0 0 66 29 
02JEE application 0 0 0 89 42 
io? ge cm application 0 0 0 96 50 


可 以 通过 以 下 方法 来 避免 : 

CIO 如 果 可 能 ， 尺 可 能 避免 运行 时 间 长 的 事务 和 WITH HOLD 的 游标 。 持 有 锁 的 时 间 越 
医 ， 与 其 他 应 用 程序 发 生 锁 争 抢 的 可 能 性 残 越 大 。 

(25) 尽 可 能 只 租 询 实际 需要 的 最 小 结果 集 ， 尤 其 是 在 REPEATABLE READ 隔离 级 唱 时 。 
因为 涉及 的 行 数 越 多 ， 友 生 锁 争 用 的 可 能 性 就 越 大 。 

(3) 避免 使 用 过 高 的 隔离 级 别 ， 隔 离 级 别 越 局 ， 发 生 锁 问题 的 可 能 性 承 越 大 。 

(4) 如 果 应 用 程序 的 商业 逻辑 允许 的 话 ， 可 以 通过 DB2 V9.5 提供 的 这 三 个 注册 变量 
db2 evaluncommitted、db2 skipdeleted 和 db2 skipinserted 来 更 改 锁 的 行为 。 这 些 设置 可 以 让 
DB2 推迟 或 者 避免 在 茶 些 情况 下 产生 锁 ， 因 而 减少 潜在 的 锁 争 用 。 

C55 如 末 所 有 的 应 用 以 相同 的 顺序 来 访问 表 中 的 数据 ， 这 样 可 以 降低 死 锁 的 概率 。 

(6) 如 果 是 使 用 DB2 V9.7 及 以 上 的 版 本 ， 将 CUR. COMMIT 设置 为 ON， 通 过 其 引入 的 
写 不 阻 窄 读 特 性 ， 能 够 大 大 降低 锁 引 友 的 问题 。 


6.7 BEWEÍTLTEBETS BER 


上 上面 介绍 了 各 种 命令 行 工 具 来 分 析 和 解决 性 能 相关 的 问题 ， 但 是 这 对 DBA 的 知识 技能 要 
求 较 高 ， 而 且 对 于 解决 复杂 的 问题 ， 即 使 是 比较 资深 的 DBA 也 需要 人 花费 大 量 的 时 间 ， 效 率 较 
低 。 而 图 形 化 的 性 能 管理 器 能 够 使 DBA 更 容易 的 发 现 问题 ， 并 且 能 够 在 相关 的 信息 之 间 快 速 
导航 ， 从 而 加 速 问 题 的 分 析 与 诊断 ， 并 快速 地 解决 问题 。 

Optim Performance Expert Manager( 傈 称 OPM) 作 为 IBM 原 厂 提供 的 图 形 化 工具 , 通过 将 各 
种 监控 信息 直观 的 表现 出 来 ， 使 DBA 易于 发 现 问题 。 

根据 不 同系 统 的 特点 ，OPM 提供 了 设置 监控 的 模板 ,这些 模 板 针对 不 同系 统 的 特点 打开 不 
同 的 监控 开关 从 而 获取 相应 的 监控 信息 。 还 针对 重要 的 信息 议 置 相应 的 准 值 ， 当 达到 或 超过 这 
WE RJE HT, OPM 能 够 灵敏 地 将 捕获 地 数据 库 信 息 以 警报 形式 迅速 发 布 。 

OPM 通过 图 表 的 形式 直接 展示 系统 运行 情况 , 通过 几 形 界面 钻 取 详细 信息 , 直到 揭示 问题 
的 根源 。 

OPM 提供 的 性 能 数据 资源 库 ， 能 够 保存 监控 信息 的 历史 ， 通 过 观察 历史 信息 发 展 的 趋势 ， 
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可 以 提前 避免 问题 ， 帮 助 数 据 库 管理 员 “ 防 患 于 未 然 ”， 是 解决 DB2 性 能 问题 的 强 有 力 工 具 。 

由 第 三 方 公 司 提供 的 Toad for DB2 是 另外 一 个 比较 实用 的 工具 ， 它 的 Spotlight on DB2 f 
块 通过 一 个 简单 的 图 形 化 界面 实时 显示 DB2 所 有 的 活动 状态 。 它 的 结构 化 视 网 精 确 地 展现 了 整 
个 DB2 环境 ， 通 过 它们 可 以 看 到 DB2 的 活动 和 健康 情况 ， 包 括 连 接 、SQL、 等 待 事件 、 锁 、 
内 存 和 磁盘 IO 等 等 相关 信息 ， 并 在 关联 的 信息 之 间 快 速 寻 航 ， 从 而 能 够 帮助 指出 问题 的 本 质 
原因 并 快速 地 找到 解决 方案 。 


6.8 ”小结 


本 章 首 先 介 绍 了 系统 监控 的 方法 和 工具 使 用 ， 包 括 CPU. LO 和 内 存 的 监控 ; 随后 对 数 
据 库 常用 监控 手段 作 了 详细 介绍 ; 为 外 ,为 了 帮助 DBA 笃 握 性 能 监控 标准 ， 给 出 了 帅 用 的 数 
据 库 关 键 性 能 指标 “KPI) ;最 后 ， 从 性 能 优化 的 角度 ， 加 广大 DBA 分 于 了 DB2 监控 的 最 佳 
实践 。 


Ax =r 
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配置 参数 与 运 维 
工具 优化 


现在 人 们 越 来 越 讲 究 生 活 品 质 ， 而 生活 的 品质 包 拓 方方面面 ， 首 先 我 们 必须 有 一 个 健康 的 
有 身体， 通过 体检 ， 能 够 监控 各 项 生理 指标 ， 当 超出 正常 泥 围 的 时 候 ， 需 要 通过 医治 或 者 锻炼 来 
使 其 达到 正常 ， 其 次 我 们 需要 一 个 恨 好 的 环境 ， 当 环境 状态 出 现 问题 的 时 候 ， 需 要 通过 绿化 等 
于 段 来 改善 环境 。 

DB2 参数 就 像 人 体 各 项 生理 指标 ， 也 需要 进行 调整 优化 才能 恨 好 地 运行 ， 而 操作 系统 作为 
DB2 的 运行 环境 ， 也 必须 优化 其 参数 ， 然 后 通过 各 种 运 维 工 具 的 使 用 ， 以 使 数据 库 系 统 发 挥 其 
最 大 的 价值 。 
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7.1 配置 参数 优化 


运动 员 必 须根 据 所 从 事 的 项 目 不 同 ， 监 控 和 调整 相应 的 生理 指标 ， 以 使 其 在 大 赛 前 达到 最 
合理 的 数值 ， 从 而 获得 好 的 比赛 成 绩 。 对 于 DB2 来 说 ， 其 配置 参数 就 像 人 体 生 理 指 标 ， 必 须根 
据 生产 系统 的 特征 ,不断 地 监控 和 调整 ， 以 达到 最 合理 的 数值 。 但 是 DB2 中 可 以 调节 的 参数 多 
种 多 样 ， 并 且 参 数 之 间 的 相互 天 系 错综复杂 ， 很 容易 率 一 发 而 动 全 号。 如 果 和 忽视 对 参数 改动 后 
的 副作用 ， 那 么 优化 参数 的 行动 就 犹如 “ 扫 和 全， 一 面 扫 ， 一 面 生 ”， 解 次 了 一 个 老 问 题 ， 还 会 
产生 痢 问 题 ， 甚 至 是 严重 的 新 问题 。 

设置 参数 实际 上 是 在 分 配 资 源 ， 宕 要 了 解 每 种 资源 的 特点 和 数据 库 中 消耗 资源 的 各 个 对 象 
之 间 的 依赖 关系 ， 依 据 上 其 体 情况 ， 对 参数 设 定 和 调整 。 

调 优 参 数 时 需要 注音 如 下 三 点 : 

(1) 要 对 工作 负载 和 系统 资源 有 深刻 的 理解 ， 应 该 根据 最 典型 的 工作 负载 状况 设置 参数 。 
每 个 系统 都 有 和 它 独 特 的 软 便 件 配置 和 工作 负载 ， 所 以 参数 配置 也 应 该 量 呈 定制， 不 俩 不 倚 ， 切 
忌 把 理论 和 经 验 生 搬 便 套 。 

(2) 多 参考 现 有 系统 的 配置 。 如 果 已 有 运行 民 好 、 业 务 特征 相似 的 系统 ， 则 可 以 依据 这 
点 系 统 中 的 相关 配置 ， 对 新 系统 进行 配置 ， 因 为 它们 已 被 证 明 是 可 徘 的 。 

G) 可 以 考虑 先 设 置 初始 值 ， 然 后 进行 微调 。 微 调 时 ， 每 次 只 调整 一 个 参数 ， 并 保留 调 
整 记录 。 如 果 调 整 无 效 ， 重 设 回 来 。 切 忌 塞 动 ， 要 有 的 放 矢 、 诺 定 而 后 动 、 控 部 束 班 地 进行 参 
数 优化 。 

配置 和 优化 系统 参数 的 工作 顺利 完成 后 ，CPU、 内 存 、 人 磁盘 和 网 络 的 处 理 能 力 会 得 到 充分 
的 利用 ,并 融 效 地 运转 。 本 市 将 从 操作 系统 层次 开始 ， 讨 论 与 性 能 相关 的 参数 配置 和 优化 方法 。 


7.1.1 操作 系统 参数 优化 


调整 操作 系统 参数 ， 以 满足 DB2 数据 库 的 要 求 ， 是 DB2 高 效 运行 的 基础 。DB2 可 以 运行 
在 多 种 操作 系统 上 ， 下 面 介绍 如 何 对 几 种 常用 操作 系统 进行 参数 优化 。 
1. AIX Bc ER 


如 果 DB2 运行 在 AIX 系统 上 , 可 以 利用 VMO 命令 (该 命令 用 于 调整 虚拟 内 存 系统 的 各 种 
参数 ) 将 系统 参数 Iru file repage 设 为 0，minperm 设 为 3。 这 将 使 DB2 从 操作 系统 直接 获取 数 
据 文 件 页 面 。 这 两 个 参数 值 是 AIX 版 本 6.1 的 默认 值 。 可 以 使 用 如 下 命令 设置 (其 中 冯 p 表示 
EEX, di ze o 表示 设置 并 显示 参数 值 ) : 


vmo -p -o lru file repage-O0 


vmo -p -o minperm$-3 


此 外 应 根据 需要 调整 系统 参数 maxservers。 这 个 参数 是 处 理 异 步 VO 的 内 核 进 程 数 ， 默 认 
为 每 个 CPU 内 核 10 个 。 可 以 根据 系统 压力 适当 增 大 。 
参数 maxreqs 应 该 被 设置 成 MAX (NUM IOCLEANERSX256,4096) 。 这 个 参数 控制 绝 大 
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多 数 突 发 的 异步 VO 请 求 。 通 过 如 下 命令 将 maxservers 设置 为 100, maxreqs 设置 为 4096 (其 
中 去 1 指定 设备 的 逻辑 名 称 ， 关 a 指定 要 更 改 的 属性 ) : 


chdev -1 aio0 -a maxservers-100 


chdev -1 aio0 -a maxreqs-4096 


Iis 13 23x queue depth 应 该 基于 队列 的 物理 便 盘 数目 设置 .例如 ,对 于 IBM Rétt queue depth 
的 默认 值 是 3， 建 议 这 个 值 设 为 〈3X 人 磁盘 数目 ) 。 这 个 参数 控制 可 排队 的 磁盘 请 求 。 如 下 命令 
设置 queue depth 为 18: 


chdev -1 hdisk20 -a queue depth-18 


做 盘 适 配 需 参数 num cmd elems 控制 排队 发 送 到 适配器 的 请 求 数 , 应 该 设置 为 所 有 与 适 配 
髓 相连 接 的 设备 queue depth 之 和 ， 如 下 命令 设置 num cmd elems 值 为 80: 


chdev -1 SCSI2 -a num cmd elems-802. Solaris 和 HP-UX 配置 


对 于 在 Solaris 或 HP-UX 平台 ， 可 以 利用 DB2 专门 提供 的 内 核 参数 设 定 工具 db2osconf 得 
到 内 核 参 数 推荐 值 。db2osconf 基于 内 存 和 CPU 能 力 ， 以 及 缩放 系数 《期 望 的 工作 负载 与 当前 
工作 负载 的 比率 ) 来 进行 配置 。 运 行 大 型 系统 如 SAP 应 用 程序 时 ， 应 该 使 用 2 或 者 更 高 的 缩放 
系数 。 在 Solaris 和 HP-UX F£, db2osconf 提供 了 很 好 的 初始 值 。 

下面 是 对 于 一 个 需要 500 个 并 发 线程 的 DB2 运行 db2osconf 的 输出 结果 (一 t 指定 并 改线 
FRA: 


—»dbZosconk -t 500 


Se msgsys:msginto msama = 65335 

set msgsys:msginfo_msgmnb 65535 

sert msgsys:msginto msgssz = 32 

sert msgsys:msginto sg s 9) 32 167 

set msgsys:msginfo msgmap A 

sert msgsys:msginto msgmni 2560 

set msgsys:msginto qe eod 2.9.00 

set semsys:seminfo semmap 3074 

St my mo E 3072 

Sut Cm YS SMeor mm 6452 

SE em yy Smeeor mm a 3072 

set semsys:seminfo semume 600 

set same ese 2134020096 
SEE nme E O Sm B9 

set shmsys:shminto shmseg 600 

Total kernel space for IPC: 

0.35MB (shm) + 1.77MB (sem) + 1.34MB (msg) == 3.46MB (TtOoTtal) 


获得 建议 值 之 后 ， 对 于 Solaris 系统 通过 在 /etc/system 文件 末尾 添加 参数 值 来 修改 。 将 以 
PATI S/etc/system 文件 的 末尾 ， 然 后 重 司 系统 ， 可 以 将 msginfo msgmax 但 更 改 65535. 


Scb SCIES 人 二 


msginfo msgmax 


69535 


对 于 HP-UX 可 以 通过 “系统 管理 器 ” (SAM) 程序 来 修改 ， 更 改 内 核 配 置 参数 的 值 之 后 ， 
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HP-UX 操作 系统 将 目 动 重 新 局 动 以 应 用 新 值 。 
3. Linux 配置 


在 Linux 系统 上 ，SHMMAX (共享 内 存 的 最 大 值 ) 应 设 为 可 用 内 存 的 90% 以 上 。 对 于 16G 
内 存 的 计算 机 ， 其 进程 间 通 信和 内核 配置 参数 以 及 推荐 值 为 : 


kernel.shmmni-4096 # (共享 内 存 段 的 最 大 数目 ) 
kernel.shmmax-17179869184 # (共享 内 存 段 的 最 大 字 节 数 ) 
kernel.shmall-8388608 # (总 的 共享 内 存 大 小 ， 单 位 : P) 
dkernel.sem-«SEMMSL» <SEMMNS> «SEMOPM» <SEMMNI> 
kernel.sem-250 256000 32 4096 # (AHE) 

#semms1l 表示 一 个 信号 量 集合 中 能 够 包含 的 信号 量 最 大 数目 。 

#semmns 表示 系统 内 可 允许 的 信号 量 最 大 数目 。 

#semopm 表示 单个 semopm () 调用 在 一 个 信号 量 集合 上 可 以 执行 的 操作 数量 。 
#semmn 表示 系统 信号 量 集 合 总 数 。 

kernel.msgmni-16384 # (消息 队列 标识 的 最 大 数目 ) 
kernel.msgmax-65536 #《 一 个 消息 的 最 大 大 小 ， 单 位 :学 他 
kernel.msgmnb-65536 #【〈 消 息 队 列 的 默认 大 小 ， 单 位 : FT) 


NA 


如 果实 际 环境 中 物理 内 存 多 于 16GB， 下 列 参数 值 SEMMSL. SEMMNS. SEMOPM, 
MSGMAX 和 MSGMNB 可 以 保持 不 变 ， 但 是 如 下 参数 值 SHMMNI、SHMMAX、SHMALL.、 
SEMMNI 和 MSGMNI 应 成 比例 增 大 。 例 如 对 于 64G 内 存 的 机 器 ， 需 要 将 SHMMAX 设置 成 
17179869184 X 4= 68719476736. 

对 于 以 上 内 核 参 数 可 以 通过 编辑 /etc/sysctl.conf 文件 来 修改 内 核 参 数值 。 如 果 此 文件 不 存 
在 ， 那 么 应 创建 它 。 修 改 后 通过 执行 “sysctl 一 p” 以 使 参数 生效 。 


7.1.2 DBM 参数 优化 


Zi FEE PES (DBM) 参数 也 称 为 实例 参数 ， 因 为 这 些 参数 都 是 实例 级 别 的 ， 对 该 实例 下 
所 有 数据 库 的 性 能 部 有 影响 。 可 以 通过 如 下 命令 全 看 所 有 的 DBM 参数 值 ， 其 中 show detail 表 
未 显示 参数 的 详细 信息 例如 延迟 生效 参数 的 更 新 值 〉: 


db2 get dbm cfg show detail 


下 面 介 绍 重 要 的 DBM 参数 及 其 优化 方法 。 
1. MAXAGENTS 


该 参数 指定 DB2 中 处 理应 用 程序 请 求 的 代理 程序 的 最 大 数目 。MAXAGENTS 的 值 应 当 大 
于 同时 活跃 的 数据 库 的 MAXAPPLS《〈 并 发 应 用 程序 最 大 数目 ) 值 的 总 和 。 最 安全 的 方案 是 将 
这 个 参数 值 设 为 NUMDB (最 大 活动 数据 库 数 ) 和 MAXAPPLS 的 乘积 。 在 通常 情况 下 ， 将 
MAXAGENTS 的 值 设 置 成 略微 大 于 数据 库 并 发 连接 的 最 大 预计 数 。 

Zi E E yas pHS ER, "Agents waiting for a token" EV "Agents stolen from another 
application" JR MAXAGENTS 的 设 定 有 关 。 在 数据 库 运 行 期 间 ， 可 以 使 用 下 面 这 个 命令 来 获取 
数据 库 管 理 器 的 快照 数据 : 


db2 get snapshot for database manager 


242 


$73 配置 参数 与 运 维 工具 优化 AR 


示例 输出 如 下 : 


High water mark for agents registered = 4 

High water mark for agents waiting for a token = 0 
Agents registered = 4 

Agents waiting for a token - 3 

Idle agents = 0 

Agents assigned from pool = 5 

Agents created from empty pool = 4 

Agents stolen from another application - 5 

High water mark for coordinating agents = 4 


Max agents overflow = 0 


如 果 发 现 “Agents waiting for a token " BV, ^ Agents stolen from another application ”不 等 于 0, 
则 需要 增加 MAXAGENTS， 以 允许 数据 库 管 理 嚣 可 以 创建 和 使 用 更 多 的 代理 程序 。 通 过 如 下 命 
令 可 以 设置 MAXAGENTS 参数 值 为 300: 


db2 update dbm cfg using MAXAGENTS 300 


2. NUM POOLAGENTS 


该 参数 用 于 控制 代理 程序 池 的 大 小 。DB2 接 到 一 个 新 的 请 求 时 ， 会 从 代理 程序 池 中 取出 一 
个 空闲 的 代理 程序 用 于 处 理 请 求 。 如 果 代 理 程序 池 中 没有 空闲 的 代理 程序 , 则 会 临时 创建 一 71 
如 果 代 理 程序 数目 多 于 NUM POOLAGENTS， 那 么 当代 理 程序 执行 完 请 求 后 ， 将 终止 运行 ， 
而 不 是 返回 到 代理 程序 池 。 

在 存在 大 量 并 发 请 求 的 OLTP 环境 中 ， 为 避免 DB2 频繁 创建 和 终止 代理 程序 ， 应 将 
NUM POOLAGENTS 设置 为 接近 于 或 等 于 MAXAGENTS 的 值 。 可 以 通过 如 下 命 人 调整 将 法 参 
数 调整 为 300， 使 用 其 等 于 MAXAGENTS 参数 值 : 


db2 update dbm cfg using NUM POOLAGENTS 300 


3. NUM INITAGENTS 


该 参数 指定 数据 库 启 动 阶段 在 代理 程序 池 中 创建 的 代理 程序 的 数量 。 在 系统 刚 启 动 并 开始 
接受 用 户 连 接 时 ， 这 些 提前 创建 的 代理 可 以 直接 用 于 处 理 用 户 请 求 。 在 大 多 数 情况 下 ， 让 
NUM INITAGENTS 保留 为 缺 省 值 会 比较 好 。 

4. FCM NUM BUFFERS 


这 个 参数 只 有 在 DPF 环境 下 才 有 用 ， 它 指定 用 于 内 部 通信 的 大 小 为 AKB 的 绥 冲 区 数量 。 
5. INTRA_PARALLEL 


此 参数 指定 数据 库 管 理 占 是 耕 可 以 使 用 分 区 内 并 行 性 。 对 于 OLTP 系统 ， 其 并 友 连 接 数 通 
Hd e, PAM di M Md 对 于 OLAP 等 并 发 连接 较 少 并 且 SOL 较 复 杂 的 情况 下 ， 开 
局 分 区 并 行 性 通 名 能 够 获 益 。 对 于 混合 工作 负载 通 销 不 局 用 分 区 内 并 行 性 。 

6. MON HEAP SZ 


此 参数 确定 分 配给 数据 库 系 统 监视 器 的 内 存量 《以 页 计 ) 。 当 进行 数据 库 监 视 活 动 时 ， 从 
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监视 器 推 分 配 内 存 。 如 果 没 有 足够 的 可 用 内 存 ， 并 且 DB2 返回 如 下 错误 号 (ADM2004E、 
ADM2005W. ADM2006W) 之 一 时 ， 可 以 将 值 设 为 1024。 如 果 还 是 过 到 错误 ， 可 以 每 次 增加 
256 直到 错误 消失 。 

7. QUERY HEAP SZ 


此 参数 是 为 了 将 每 个 查询 存储 到 代理 的 私有 内 存 时 可 以 分 配 的 最 大 内 存量 。 可 以 用 如 下 命 
邻 调整 为 250 (4k 页 大 小 ) 。 


db2 update dbm cfg using QUERY HEAP SZ 250 


7.1.3 DB 参数 优化 


DB 参数 也 就 是 数据 库 配 置 参数 ， 可 以 使 用 数据 库 配 置 建议 程序 ， 也 驶 是 通常 所 说 的 
AUTOCONFIGURE 命令 进行 设 定 。 这 个 工具 根据 提供 的 系统 负载 情况 ， 目 动 生 成 一 系列 数据 
库 配 置 参数 的 初始 值 。 使 用 AUTOCONFIGURE 应 该 注意 下 面 几 点 : 

e 在 数据 库 完 成 数据 装 入 后 ， 再 运行 AUTOCONFIGURE 。 这 样 做 的 原因 是 ， 让 
AUTOCONFIGURE 计算 推荐 值 时 ,依据 正常 状态 下 的 数据 量 ， 太 多 或 太 少 的 数据 都 将 
降低 计算 的 精度 。 

e 对 所 有 选项 指定 符合 实际 的 值 ， 因 为 默认 值 可 能 并 不 适用 于 你 的 系统 。 例 如 
MEM PERCENT 默认 值 设置 为 25%， 对 于 一 个 只 运行 DB2 数据 库 的 服务 器 来 说 这 个 
值 太 低 了 ， 应 该 设 为 60% 以 上 。 

e 使 用 “APPLY NONE” 选 项 反复 运行 AUTOCONFIGURE 来 试验 不 同 的 选项 值 ， 并 对 
比 所 得 到 的 结果 。 

下 面 是 一 个 运行 autoconfigure 工具 的 例子 : 


DB2 AUTOCONFIGURE USING MEM PERCENT 60 WORKLOAD TYPE MIXED NUM STMTS 20 TEM 500 
ADMIN PRIORITY BOTHIS POPULATED YES NUM LOCAL APPS O NUM REMOTE APPS 20 ISOLATTON 
RRSP RESIZBABLE YES APPLY NONE 


autoconfigure 的 参数 及 其 含义 如 表 7-1 所 示 : 


表 7-1 autoconfigure 命令 的 参数 及 有 效 值 


参数 名 称 有 效 信 "m 
mem percent 分 配给 数据 库 的 实例 内 存 比 例 
workload type simple, mixed, mixed | 简单 工作 负载 通常 指 IO 密集 工作 负载 ， 而 
complex 复 末 工作 负载 通常 是 CPU 密集 负载 
"pm 每 工作 单元 包含 的 语句 数目 
Tpm | 120000 |o | 每 分 名 事务 
还 是 恢复 优先 


Admin priority performance, both 性 能 优先 
recovery, both 


is populated yes Zi de t C ze te eI CDS FE 
num local apps | oso | — do | 连接 到 数据 库 的 本 地 应 用 数目 
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CRK) 
SMEM m 
num remote apps "um —]na- 连接 到 数据 库 的 远程 应 用 数目 
isolation 连接 到 数据 库 应 用 的 最 高 隔离 级 别 


bp resizeable yes, no yes 缓冲 池 大 小 是 否 能 够 调整 
APPLY DBONLY, DBAND | X 指定 命令 作用 的 范围 ， 当 使 用 NONE 时 ,只 
DB，NONE 显示 建议 参数 而 不 实际 应 用 


AUTOCONFIGURE 一 般 会 对 内 存 相 关 的 参数 设置 为 AUTOMATIC， 这 样 束 可 以 利用 内 存 
自动 调节 (STMM) 功能 进行 自动 管理 。 

AUTOCONFIGURE 通常 用 来 进行 初始 设置 ， 然 后 ，DBA 还 需要 根据 系统 的 运行 情况 进行 
持续 的 调整 。 下 面 束 来 探讨 一 下 如 何 调整 一 些 重要 的 数据 库 配 置 参 数 。 


1. 缓冲 池 


数据 库 被 创建 时 ， 会 创建 一 个 缺 省 的 缓冲 池 ， 即 IBMDEFAULTBP。 绥 冲 池 的 大 小 首先 取 
次 于 SYSCAT.BUFFERPOOLS 目录 表 中 对 应 该 缕 冲 池 的 NPAGES 值 。 如 果 NPAGES 为 - 1， 
则 缓冲 池 的 大 小 取决 于 数据 库 配 置 参 数 BUFFPAGE。BUFFPAGE 参数 的 缺 省 值 非常 小 ， 应 根 
据 数 据 库 的 大 小 和 应 用 程序 的 性 质 ， 将 该 参数 设置 成 一 个 合理 的 值 。 请 考虑 下 列 情况 : 

CD 对 于 大 型 BIOLAP 数据 库 ， 将 BUFFPAGE 设置 成 机 器 总 内 存 的 50%。 
(2) 对 于 大 型 OLTP 数据 库 ， 将 BUFFPAGE 设置 成 机 器 总 内 存 的 75%。 

通过 如 下 命令 可 以 将 缓冲 池 DATABP4K(PAGESIZE 为 A4KO Ji J 48G, 并 使 用 immediate 

选项 使 其 立即 生效 : 


db2 alter bufferpool DATABP4K immediate size -1 
db2 update db cfg buffpage using 12000000 


当然 也 可 以 通过 如 下 命令 直接 将 缓冲 池 大 小 设置 为 48G: 


db2 alter bufferpool DATABP4K immediate size 12000000 


VETE Dit dec RE TR b Se 2E pL dO rp, IRI E nor E E a P3 88] 2E rp TU EIS] i np 
率 。 下 面 的 语句 是 利用 SYSIBMADM.BP HITRATIO 得 到 命中 率 : 


SELECT SUBSTR (do name, 1,8) AS DB NAME, SUBSTR (OB nane,1,14) AS BP NAME, 
Cocal lPi rao per en aeS T TOTALT I A a a a O per en o DATATE; 
Index nit racio percent as INDEX HR, xda nit ratio percent as XDA MR; 
Dbpartitionnum as DBPARTNUM 

BEOMON EADM E E IPIE CO 

(EIUEIESSE Y c ee 


AED B. MPRA 95%， 并 尽 可 能 接近 100%。 要 提高 缓冲 池 命中 率 ， 请 符 试 
下 面 这 些 方法 : 

C1) 增加 绥 冲 池 大 小 。 

(2) 券 虑 分配 多 个 缓冲 池 。 如 果 可 能 的 话 ， 为 热 表 所 属 的 表 空 间 分 配 一 个 单独 的 缓冲 池 ; 
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为 冷 表 分 配 男 外 一 个 缓冲 池 。 然 后 尝试 改变 这 些 缓冲 池 的 大 小 ， 最 终 找到 一 个 最 合理 的 设置 。 
G 注意 : 缓冲 池 参 数 设置 
有 时 候 不 断 增加 缓冲 池 的 大 小 并 不 能 提高 缓冲 池 命中 率 。 这 时 问题 的 根源 可 能 不 在 
缓冲 池 的 大 小 ， 继 续 增加 缓冲 池 的 大 小 可 能 事 得 其 反 ， 当 缓冲 池 过 大 导致 操作 系统 物理 

内 存 不 足 时 ， 频 繁 使 用 虚拟 内 存 反 而 会 降低 性 能 ， 


2. 私有 排序 阅 值 ‘sheapthres) 、 共 享 排 序 阅 值 (SHEAPTHRES_SHR) 及 排序 堆 大 小 
(SORTHEAP) 


sheapthres 是 个 实例 级 参数 ， 表 示 整 个 实例 范围 内 私有 排序 总 内 存 的 软 限制 ， 如 果 私 有 排 
序 内 存 使 用 超过 这 个 限制 ， 则 新 请 求 的 私有 排序 内 存 分 配 将 会 大 幅 减 少 。 如 果 sheapthres 被 设 
'& y 0 fii, 则 DB2 使 用 共享 排序 。 如 果 sheapthres 被 设置 为 非 0 值 , 表示 DB2 将 使 用 私有 排序 ， 
排序 内 存在 代理 中 分 配 ，SORTHEAP 参数 此 时 则 规定 了 每 个 私有 排序 最 多 使 用 的 内 存量 , IBM 
信息 中 心 的 推荐 是 将 sheapthres 设置 为 SORTHEAP 的 整数 倍 ， 至 少 为 实例 中 最 大 SORTHEAP 
值 的 2 倍 。 

SHEAPTHRES SHR 与 sheapthres 很 容易 混淆 ， 为 了 便于 大 家 理解 ， 特 列 出 它们 二 者 之 间 
的 主要 区 别 : 

(1) SHEAPTHRES SHR 中 的 SHR 代表 Share， 表 示 共 享 内 存 的 限制 ， 而 sheapthres 代表 
私有 内 存 的 限制 。 

(2)SHEAPTHRES_SHR 是 数据 库 级 参数 , 代表 数据 库 范 围 的 共享 排序 内 存 限 制 , 而 sheapthres 
是 实例 级 参数 ， 代 表 实 例 范 围 的 私有 排序 内 存 限 制 。 

(3) SHEAPTHRES SHR 与 sheapthres Æ AZK, WR sheapthres 为 0，DB2 使 用 共享 排序 ， 
SHEAPTHRES SHR 才 起 作用 ， 如 果 sheapthres 不 为 0，SHEAPTHRES SHR 基本 就 没 用 了 ， 除 
非 开 局 了 内 部 并 行 度 Cintra parallel 为 YES) 或 者 max connections 参数 的 值 大 于 max coordagent， 
这 时 会 使 用 共享 排序 。 

(4) SHEAPTHRES SHR 与 sheapthres 都 是 可 以 在 线 调整 的 ， 但 sheapthres 在 从 0 调 到 非 
0 值 时 需要 重新 局 动 实例 才能 生效 。 

要 更 改 SHEAPTHRES 和 SORTHEAP 的 值 ， 可 以 运行 以 下 命令 ， 其 中 将 SHEAPTHRES X 
置 为 0， 表示 启用 共享 排序 ，SORTHEAP 大 小 设置 为 25600X 4k=100M。 


db2 update dbm cfg using SHEAPTHRES 0 
db2 update db cfg for DB NAME using SORTHEAP 25600 


3. /O 服务 器 的 数目 (NUM IOSERVERS) 


DB2 中 访问 表 数 据 以 及 备份 和 恢复 之 类 的 操作 都 要 利用 VO 服务 器 (实际 上 是 执行 专门 任 
务 的 代理 程序 ) 执行 预 取 操 作 。 当 配置 足够 的 UO 服务 器 时 ， 可 以 大 大 提高 能 够 受益 于 预 取 的 
丛 询 的 性 能 。 为 了 最 大 程度 地 提高 并 行 VO 的 机 会 ，NUM_IOSERVERS 至 少 需要 等 于 数据 库 
中 的 物理 人 厂 盘 数 。 建 议 将 此 参数 设 为 AUTOMATIC, ib DB2 日 动 调 市 。 


4. 异步 页 清除 程序 的 数目 (NUM IOCLEANERS) 


NUM IOCLEANERS 指定 了 数据 库 的 异步 页 清除 代理 程序 的 数目 。 这 些 页 清除 程序 将 缓冲 
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池 中 已 更 改 的 页 异步 地 写 到 磁盘， 从 而 释放 这 些 页 。 这 使 得 请 求 新 页 的 代理 程序 不 必 等 待 已 更 
改 页 被 写 到 人 磁盘， 就 可 以 获得 可 用 的 新 页 ， 从 而 加 快 租 询 的 处 理 。 

如 果 将 该 参数 设置 成 0， 则 不 局 动 页 清除 程序 。 这 样 DB2 代理 程序 在 使 用 绥 冲 池 的 时 候 ， 
当 发 现 没有 立即 可 用 的 页 时 ， 必 须要 等 待 将 缓冲 池 中 已 更 改 的 页 同步 写 到 人 厂 盘 。 另 外 ， 不 启动 
页 面 清除 ， 会 使 DB2 无 法 宛 分 利用 磁盘 的 融 宽 ， 可 能 使 某 些 磁盘 有 时 处 于 不 合理 的 空闲 状态 。 

如 采 应 用 程序 主要 执行 更 新 数据 的 事务 ， 增 加 页 清除 程序 的 数目 会 提高 性 能 。 增 加 页 清除 
程序 的 数量 还 会 减少 故障 〈 比 如 断 电 ) 的 恢复 时 间 ， 因 为 大 部 分 更 新 后 的 数据 可 能 已 经 被 写 入 
倒 盘 而 无 须 恢 复 。 该 参数 也 可 以 设 为 AUTOMATIC, ib DB2 日 动 调 市 。 

5. 更 改 页 阅 值 (CHNGPGS THRESH) 


这 个 参数 指定 绥 冲 池 中 被 更 改 页 面 占 所 有 页 和 面 的 百分比 达到 多 少时 ， 将 局 动 卉 步 页 面 清除 
程序 ， 来 将 缓冲 池 中 被 更 改 的 数据 页 异步 写 到 磁盘。 在 只 读 环境 下 ， 不 需要 局 动 寞 步 页 面 清除 
程序 。 在 OLAP 环境 中 ， 如 果 没 有 很 多 的 INSERT 或 UPDATE 语句， 使 用 缺 省 值 60 就 可 以 了 。 
在 OLTP 环境 中 ， 一 般 将 它 设 为 20~40 之 间 的 一 个 值 。 这 个 值 越 低 ， 页 面 清 除 程序 将 脏 数 据 从 
绥 冲 池 页 和 面 写 到 磁 副 就 越 频 或 ， 但 是 每 次 写 的 数据 量 会 越 少 。 

SARIEK RREA, WR “Dirty page steal cleaner triggers ”是 一 个 两 位 数 ， 则 试 
看 降低 这 个 参数 。 如 果 “Buffer pool data writes” 较 局 ， 而 “Asynchronous pool data page writes” 
较 低 ， 则 也 应 该 降低 这 个 参数 。 

al 22 CHNGPGS THRESH 不 起 作用 ， 可 以 设 定 注册 变量 DB2 USER 
ALTERNATE PAGE CLEANING 为 YES， 这 时 将 启用 新 的 清 页 算法 。 使 用 新 算法 时 ， 要 把 
NUM IOSERVERS 至 少 设 为 3， 否 则 新 算法 的 性 能 将 受到 影响 。 

6. MAXAPPLS 


该 参数 指定 了 允许 连接 到 DB2 的 并 发 应 用 程序 的 最 大 数量 。 由 于 需要 给 连接 到 DB2 的 每 
个 应 用 程序 分 配 私有 内 存 ， 所 以 并 发 连接 越 多 ， 内 存 消耗 也 会 更 多 。 

运行 OLTP 应 用 程序 时 ， 要 保证 MAXAPPLS 的 值 能 容纳 最 多 的 并 发 用 户 和 连接 。 对 于 那 
些 使 用 连接 池 的 应 用 程序 ， 建 议 将 MAXAPPLS 的 值 设 置 成 比 连接 池 的 大 小 大 1 或 2， 这 样 做 
只 是 为 了 以 防 需要 调用 命令 行 连接 来 同时 做 一 些 事情 。 

7. PCKCACHESZ 


该 参数 指定 包 绥 存 的 大 小 ， 包 缓存 是 在 数据 库 共 孚 闪存 之 外 分 配 的 ， 并 且 用 于 高 速 缓存 数 
据 库 上 的 静态 和 动态 SQL 和 XQuery 语句 的 访问 计划 ， 在 与 数据 库 连 接 的 应 用 程序 多 次 使 用 同 
一 个 语句 时 ， 能 够 提高 性 能 ， 这 对 于 事务 处 理 环境 尤其 重要 。 

8. CATALOGCACHE SZ 


该 参数 指定 目录 高 速 缓存 可 以 使 用 的 数据 库 扒 中 的 最 大 空间 《以 页 计 ) . Ho en AXE 
于 噩 速 绥 存 系统 目录 信息 。 在 分 区 数据 库 系 统 中 ， 每 个 数据 库 分 区 部 有 一 个 目录 局 速 绥 存 。 局 
速 缓存 各 个 数据 库 分 区 中 的 目录 信息 允许 数据 库 管 理 器 不 需要 访问 系统 目录 《或 分 区 数据 库 环 
境 中 的 目录 节 氮 ) 来 效 取 先前 检测 的 信息 ， 从 而 降低 其 内 部 开销 。 使 用 目录 高 速 缓存 可 以 帮助 
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提高 下 列 各 项 的 整体 性 能 : 

e 绑 定 程序 包 以 及 编译 SQL 和 XQuery 语句 。 

e 涉及 到 检查 数据 库 级 别 特 权 、 例 程 特 权 、 全 局 变量 特权 和 角色 权限 的 操作 。 

e 连接 至 分 区 数据 库 环 境 中 的 非 目 录 节 点 的 应 用 程序 。 

如 果 工 作 负 载 需 要 在 短 时 间 内 编译 许多 SQL 或 XQuery， 且 其 后 很 少 或 不 进行 编译 ， 那 
么 增 大 此 参数 尤其 重要 。 但 是 如 条 局 速 缓存 太 大 ， 那 么 可 能 会 因 保 留 不 再 使 用 的 信息 的 副本 而 
浪 旨 内存。 在 分 区 数据 库 的 环境 上 ,通常 需要 将 目 杂 市 点 上 的 catalogcache sz 设置 为 更 大 一 些 ， 
ELA AE H RKT ux E05 22 BR] H o fei Ads 2e 2E 76 TE H ox n na ERT e 

9. DFT. QUERYOPT 


在 编译 SQL 和 XQuery 得 询 时 ， 这 个 参数 用 于 指导 优化 堪 使 用 不 同 程度 的 优化 级 ， 默 认 值 
是 5。 在 既 没 有 使 用 SET CURRENT QUERY OPTIMIZATION 语句 ， 也 没有 使 用 绑 定 命令 的 
QUERYOPT 选项 时 ，DB2 使 用 DFT QUERYOPT 这 个 参数 的 设置 作为 默认 优化 级 。 


10. 锁 相 天 参数 (LOCKLIST、MAXLOCKS 和 LOCKTIMEOUT ) 


与 锁 相 关 的 DB 参数 包括 LOCKLIST、MAXLOCKS 和 LOCKTIMEOUT。 
(1) LOCKLIST 设 定 锁 列 表 绥 剖 区 的 最 大 空间 。 
(2) MAXLOCKS 指定 了 人 允许 应 用 程序 占用 的 锁 列 表 的 百分比 。 当 锁 列 表 耗 尽 或 者 一 个 应 
用 程序 所 拥有 的 锁 大 于 MAXLOCKSXLOCKLIST 的 时 候 ，DB2 就 会 试图 把 几 个 行 锁 合 并 为 一 
个 表 锁 ， 从 而 释放 锁 空 间 。 虽 然 锁 升 级 本 身 并 不 耗费 多 少时 间 ， 但 是 锁 住 整个 表 通 常会 大 大 地 
降低 并 发 性 能 。 
(3) LOCKTIMEOUT 指定 应 用 程序 为 获取 锁 所 等 竺 的 最 多 时 间 ， 单 位 为 秒 。 
e ”如果 将 该 参数 设置 成 0， 那 么 应 用 程序 将 不 会 等 每 。 如果 锁 请 求 没 有 得 到 满足 ， 会 返回 
911 错误 代码 。 
e 如 果 将 该 参数 设置 成 -1， 那么 将 关闭 锁 超时 检测 。 在 这 种 情形 中 ,应 用 程序 将 一 直 等 待 
到 获得 锁 为 止 。 
可 以 通过 如 下 命令 更 改 上 面 介 绍 的 三 个 参数 : 
QB> update dbo cfg for sample using LOCKLIST 800 


db2 update db cfg for sample using MAXLOCKS 50 
db2 update db cfg for sample using LOCKTIMOUT 30 


11. 应 用 程序 堆 大 小 (APPLHEAPSZ) 


这 个 参数 定义 了 一 个 代理 程序 或 子 代理 程序 可 以 使 用 的 私有 内 存 页 数 。 在 DB2 初始 化 代理 
程序 或 子 代 理 程序 时 ， 会 先 分 配 一 个 较 小 的 扒 空 间 。 当 代理 程序 或 子 代 理 程序 需要 更 多 的 扒 衬 
间 以 处 理 较 大 的 SQL 语句 时 ,数据库 管理 器 将 近 照 需要 增加 ,直到 所 分 配 的 内 存 大 小 达到 该 参 
数 所 指定 的 最 大 值 。 当 应 用 程序 接收 到 一 个 表明 应 用 程序 扒 空 间 不 够 的 错误 号 SQL0954C 时 ， 
应 该 增加 APPLHEAPSZ 的 值 。 


12. 日 志 相 关 参 数 


(1) LOGPRIMARY: 指定 要 预先 分 配 空间 的 主 日 志文 件 个 数 。 
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(2) LOGSECOND: 当主 日 志文 件 个 数 不 够 用 时 ， 请 局 用 从 日 忘 文件 ， 从 日 志文 件 的 最 
大 个 数 束 是 这 个 参数 的 设 定 值 。 

(3) LOGFILSZ: 日 志文 件 的 大 小 。 

(4) LOGPATH/NEWLOGPATH: 这 个 参数 决定 事务 日 志 的 位 置 。 和 需要 注意 的 是 ， 事 务 日 
志 不 应 和 数据 表 空 间 共 享 磁盘 ， 应 放 在 有 足够 UO 能 力 的 独立 人 磁盘 上 。 

(5) LOGBUFSZ: 这 个 参数 决定 事务 日 六 的 内 部 缓存 大 小 《单位 为 4EB) . SATB 8, 
这 个 值 应 该 设置 更 大 一 些 。 

(6) DIAGPATH: 这 个 参数 决定 了 DB2 诊断 日 志文 件 的 存放 位 置 。 在 DPF 环境 中 ， 应 该 
将 DIAGPATH 设置 为 每 个 分 区 的 本 地 非 NFS 路 径 。 这 样 可 以 避免 所 有 分 区 向 同一 个 文件 写 入 
诊断 信息 。 

(7) MINCOMMIT: 一 直 等 到 事务 请 求 数 达到 这 个 值 ， 日 志 才 会 写 到 磁盘， 这 将 有 助 于 
减少 日 志文 件 UO 的 次 数 。MINCOMMIT 的 缺 省 值 为 1， 当 运行 多 个 应 用 程序 ， 并 且 在 非常 短 
的 时 间 内 ， 应 用 的 事务 请 求 大 量 提交 时 ， 增 大 MINCOMMIT 的 值 ， 可 以 提高 性 能 。 另 外 ， 在 增 
大 MINCOMMIT 时 ， 还 需要 增 大 LOGBUFSZ 参数 ， 以 避免 日 志 绥 冲 区 因 写 满 而 被 强制 号 入 夏 
盘 。LOGBUFSZ 应 该 设 为 : 


MINCOMMIT * (事务 使 用 的 日 志 空 间 的 平均 值 ) 
13. 语句 集中 器 参数 


DB2 V9.7 推出 了 语句 集中 器 功能 ， 能 上 自动 分 析 动 态 SQL 语句 ， 对 于 只 是 常量 不 同 的 动态 
SQL 语句 ， 能 让 它们 自动 地 共享 含有 参数 标记 的 SQL 语句 ， 从 而 避免 修改 应 用 程序 。 于 是 ， 这 
些 相 似 的 SQL 语句 都 能 命中 高 速 缓 存 ， 共 享 访问 计划 ， 节 省 了 编译 时 间 和 CPU 开销 。 

缺 省 情况 下 ， 语 句 集中 器 处 于 禁用 状态 。 如 果 和 希望 对 所 有 动态 语句 启用 语句 集中 堪 ， 只 需 
将 STMT CONC 这 个 数据 库 配置 参数 设置 为 LITERALS， 如 下 所 示 : 


Cho DGaLEG obs. ctg using STMT CONC LITERALS 
RT E * 
7.1.4 注册 变量 优化 


1. DB2 PARALLEL IO 注册 变量 


X] T UH Ze RÀ BRA EUH Hs BRA TROU P. DB2o8 — P x*RIREEE SS 7 UXOR AR BT TR 
取 请 求 。 但 是 如 果 容 器 含有 多 个 磁盘 ， 实 际 上 应 该 对 它 同 时 发 送 多 个 预 取 请 求 。 最 条 单 用 法 如 
下 ， 意 思 是 所 有 表 衬 间 都 将 使 用 6 作为 每 个 容 絮 的 磁盘 数 ， 其 中 6 ABARCA. 


DB2 PARALLEL IO-* 


如 果 容 器 在 一 个 5 块 硬盘 的 RAID-5 ADIP) E, 则 可 以 设置 B2 PARALLEL IO 为 “*:4”， 
其 中 虽然 是 5 块 盘 ， 但 是 1 块 用 于 校 验 ， 只 有 4 块 用 来 存放 数据 。 


DONNE OM 


2. DB2CODEPAGE 注册 变量 


通常 DB2 会 日 动 从 操作 系统 读 取 该 代 人 码 页 信息 ， 所 以 不 需要 设置 DB2CODEPAGE。 但 是 
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如 果 服 务 器 和 客户 端 代 码 页 不 匹配 时 ， 可 以 通过 db2set 命令 来 修改 该 值 ， 执 行 下 面 的 命令 可 以 
将 该 DB2CODEPAGE 设置 为 1208〈 表 示 Unicode 代码 页 ) : 
db2set db2codepage-1208 


3. DB2COMM 注册 变量 


通过 DB2COMM 注册 表 变 量 为 当前 DB2 实例 设置 通信 协议 .如果 该 注册 表 变 量 未 定义 或 
设置 为 空 ， 那 么 局 动 数 据 库 管理 器 时 不 会 启动 任何 协议 连接 管理 器 。 通 过 如 下 命令 设置 通过 
TCP/IP 连接 到 当前 DB2: 


db2set DB2COMM-TCPIP 


50000， 要 修改 或 者 查看 这 个 端口 号 ， 可 以 查看 DBM 参数 SVCENAME 值 ， 例 如 
db2c inst1， 然 后 在 services 文件 中 找到 键 db2c inst1， 其 值 (50000/tep ) 就 是 访问 的 端 
口号 ， 通 过 将 50000 修改 成 其 他 的 值 ， 例 如 50005， 然 后 重启 实例 ， 就 可 以 将 访问 端口 
更 改 为 50005. 对 于 Windows 操 作 系 统 ,services 文 件 位 于 C:\Windows\System32\drivers\etc 
目录 下 ， 而 对 于 Unix 或 者 Linux 操作 系统 ，services 文件 位 于 /etc A RF. 


7.1.5 弟 见 问题 总 结 


参数 设置 不 当 会 引起 很 多 性 能 问题 , 甚至 是 严重 的 系统 瓶 贷 。 下 面 是 震 要 特别 注意 的 地 方 : 

CIO 们 盘 的 吞吐 量 取 雇 于 人 厂 盘 个 数 。 那 些 具 有 大 型 用 户 表 或 临时 表 的 表 空 间 ， 应 该 尽量 
TAEA Ri 

(2) 缓冲 池 可 以 占用 可 用 内 存 的 大 约 75% (OLTP) 2X 50% COLAP) 。 

(3) 应 该 增加 SORTHEAP， 以 避免 排序 溢出 。 

(4) 在 高 性 能 的 独立 磁盘 上 存放 本 地 事务 日 志 。 

(5) 在 数据 仓库 应 用 中 ， 如 果 数 据 量 超过 300GB， 应 考虑 使 用 DPF 分 区 功能 。 使 用 数据 
库 配 置 建议 程序 ， 可 以 获得 恨 好 的 初始 配置 设置 。 

(60 对 DPF 环境 ， 使 用 本 地 文件 ， 而 不 是 NFS 文件 作为 诊断 日 六 路 径 。 


nih 7 LB . 
7.2 日 常 运 维 工具 的 使 用 与 优化 
数据 库 运 维 束 像 一 场 持 久 战 ， 必 须 熟 读 兵 法 , 并且 根 据 实际 战局 的 发 展 ， 进行 姑 活 的 运用 ， 
才能 取得 最 后 战役 的 胜利 。 
7.2.1 知已 知 彼 一 一 统计 信息 收集 


近年 来 区 屏 上 《 信 枪 》、《 潜 伏 》、《 黎 明之 前 》 等 诛 碾 请 热 播 ， 引 起 人 们 的 极 大 兴趣 ， 
娱乐 之 余 , 也 说 明了 一 个 事实 , 情报 工作 对 于 战争 的 胜 负 起 看 公关 重 要 的 作用 ,对 于 DB2 而 言 ， 
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收集 情报 、 统 计 信 息 也 同样 重要 ， 优 化 器 需要 统计 信息 生成 访问 计划 ， 不 准确 的 统计 信息 就 像 
战争 中 的 假 情 报 一 样 ， 会 让 优化 器 选择 错误 的 访问 计划 ， 从 而 影响 查询 的 性 能 。 

统计 信息 收集 的 命令 比较 简单 ， 例 如 可 以 使 用 下 面 的 命令 对 表 EMPLOYEE 执行 
RUNSTATS 操作 。 这 个 命令 将 更 新 EMPLOYEE 表 及 其 上 的 所 有 索引 的 统计 信息 。 


db2 "runstats on table EMPLOYEE with distribution and detailed index all" 


通 单 在 以 下 情况 ， 需 要 进行 统计 信息 的 收集 。 
当 表 的 数据 经 过 大 量 的 增删 改 之 后 。 
当 表 经 过 重组 之 后 。 

e 当 创 建新 的 索引 之 后 。 

e 运行 bind 命令 之 前 。 

e 当 prefectch 参数 改变 之 后 。 

由 于 统计 信息 的 收集 同样 需要 消耗 资源 ， 因 此 需要 快速 而 高 效 地 收集 统计 信息 ， 从 而 尽 可 
能 降低 统计 信息 收集 对 于 系统 的 影 啊 。 

为 了 避免 不 必要 的 统计 信息 收集 ， 只 对 没有 收集 或 者 较 长 时 间 没 有 收集 统计 信息 的 表 或 者 
索引 收集 统计 信息 ， 使 用 下 面 的 语句 可 以 找 出 没有 收集 过 统计 信息 的 表 : 


do» Tselcct tabname from syscat.- tables where stats time is nulli 


使 用 下 面 的 语句 碍 找 没有 收集 过 统计 信息 的 索引 : 


dba Mselcet indname from sysCat.indekes where stats time is nuli” 


SEH PERES AEREA 15 天 内 没有 更 新 过 统计 信息 的 表 和 索引 : 


OUS "suele re onene ION S wee E. eUOd eS see siis iN « Cet besten c 05 ess 


Ole "ele Oe Ss wie: e siEeS i-e a usw 1 se 


对 于 以 上 查询 结果 中 的 表 或 者 索引 执行 RUNSTATS 来 更 新 统计 信息 ， 以 使 DB2 的 查询 优 
化 器 能 够 选择 最 优 的 查询 访问 计划 。 
统计 数据 收集 的 速度 与 目标 表 的 数据 量 、 目 标 表 上 的 列 数 目 、 目 标 表 上 的 索引 数目 以 及 统 
计 信 息 的 详细 程度 有 看 极 大 关系 。 因 此 为 了 优化 runstats， 需 遵循 以 下 原则 : 
(OD 只 对 需要 的 列 收集 统计 信息 ， 对 于 SQL 语句 中 出 现在 WHERE 子 句 中 的 列 ， 或 者 
JOIN 条 件 中 的 列 以 及 GROUP BY/ORDER BY 等 子 句 中 的 列 收 集 统计 信息 。 
(2) 创建 案 引 的 同时 收集 统计 信息 ， 并 且 根 据 数 据 量 和 但 询 的 逢 要 选择 DETAILED 或 者 
SAMPLED 参数 。 
(3) 使 用 LOAD 命令 的 REPLACE 选项 问 表 中 加 载 数 据 时 ， 指 定 STATISTICS USE 
PROFILE 参数 ， 在 加 载 数 据 的 同时 ， 收 集 统计 信息 。 
(4) 对 于 较 大 的 非 关键 的 表 使 用 SAMPLED 参数 ， 能 够 加 快 RUNSTATS 执行 速度 。 


7.2.2 ”集中 兵力 碎片 整理 工具 


数据 库 运 行 一 段 时 间 后 ， 当 其 中 的 表 经 过 大 量 搬 入 (Insert)、 更 新 CUpdate)、 删除 (Delete) 
等 操作 后 ， 数 据 分 布 驶 会 非常 分 做 ， 从 而 会 增加 LO 操作 ， 降 低 系统 的 性 能 ， 因 此 需要 对 表 及 
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其 索引 进行 重组 〈 即 执行 REORG 操作 ) 将 数据 重新 组 织 。 因 为 REORG HEIE VERE, DTE 
DB2 提供 了 REORGECHK 命令 ， 用 于 检 答 是 否 应 该 进行 REORG 操作 。 在 整个 运 维 期 间 ， 
定期 地 对 表 执 行 REORGCHK 命令 。REORGCHK 首先 调用 RUNSTATS， 更 新 表 的 统计 信息 ， 
然后 利用 这 些 新 的 统计 信息 , 通过 一 些 预先 定义 的 公式 (在 命令 的 输出 里 面 可 以 看 到 这 些 公式 ) 
进行 计算 ， 来 判断 表 是 否 需 要 重组 。 

下 面 的 命令 输出 中 ， 分 别 显 示 了 表 和 索引 的 统计 信息 ， 以 及 通过 公式 计算 出 的 值 。 如 果 计 
FR AEDS SIRE, Pw, X TEST A e F2 为 40, "TBI 70, X} 
应 的 位 置 束 会 显示 “*”， 奋 则 就 会 显示 “ 。 如 果 对 应 的 REORG 列 出 现 一 个 或 多 个 “*” 
时 ， 就 说 明 应 该 考虑 对 该 表 或 索引 进行 重组 操作 。 


=> db2 reorgchk update statistics on table all 


Deum eu ENS TES 


Table statistics: 


Fl: 100 * OVERFLOW / CARD < 5 € V SEA RI BI 
F2: 100 * (Effective Space Utilization of Data Pages) » 70 
F3: 100 * (Required Pages / Total Pages) » 80 


SCHEMA.NAME CARD OV NP EP ACTBLK TSIZE F1 F2 F3 REORG 


Tables PIN IPIE TEST 


Table: IIFVT14.NEWTEST 
196620 0 982 1024 = 3932400 0 OG 96 === 


Index statistics: 
F4: CLUSTERRATIO or normalized CLUSTERFACTOR > 80 


F5: 100 * (Space used on leaf pages / 
Space available on non-empty leaf pages) » MIN(50, (100 - PCTFREE)) 


F6: (100 - PCTFREE) * (Amount of space available in an index with one less level 
/ Amount of space required for all keys) « 100 


F7: 100 * (Number of pseudo-deleted RIDs / Total number of RIDs) « 20 
F8: 100 * (Number of pseudo-empty leaf pages / Total number of leaf pages) « 20 


SCHEMA . NAME INDCARD FA FS FO P7 FO REORG 
Table: IIFVT14.NEWTEST 
Index: IIFVT14.NI 

196620 98 92 = D nc TE 
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对 于 需要 重组 的 表 ( 即 需要 执行 REORG 的 表 )， 通常 选择 在 系统 的 维护 窗口 来 执行 章 组 ， 
并 需要 在 维护 窗口 结束 前 做 完 。 

使 用 下 面 的 REORG 命令 对 表 TEST 及 其 索引 进行 实际 的 重组 : 

# 对 表 NEWTTEST 进行 重组 〈 表 上 的 索引 将 自动 被 重组 ) 

db2 reorg table TEST 


# 只 重组 表 NEWTEST 的 索引 
db2 reorg indexes all for table TEST 


以 下 对 于 REORG 工具 的 优化 和 建议 可 以 加 快 REORG 的 进程 ， 并 减 小 REORG 期 间 所 造 

成 的 影 啊 : 

(1) 通常 REORG 耗 时 很 长 , 而 且 REORG 期 间 用 户 一 般 不 能 访问 表 , 所 以 在 REORG 前 ， 
应 该 通过 分 析 REORGCHK 命令 的 结果 ， 只 对 需要 REORG 的 表 或 索引 进行 REORG. 

(20 对 于 从 来 不 使 用 的 索引 ， 应 将 其 删除 ， 以 节省 REORG 的 成 本 。 

(3) REORG 期 间 会 使 用 临时 表 空 间 ， 因 此 将 临时 表 空 间 定 义 在 性 能 较 好 的 存储 上 能 够 提 
高 REORG 的 速度 。 

(4) 对 于 关键 业务 系统 ， 可 以 使 用 ONLINE REORG， 并 实施 监控 ， 以 便 在 出 现 性 能 问题 
时 能 够 终止 REORG 操作 。 

(5) 对 表 进 行 OFFLINE REORG 后 ， 无 须 再 对 索引 进行 REORG， 因 为 OFFLINE REORG 
后 ， 会 重建 相应 的 索引 。 

(6) REORG 后 , 需要 通过 RUNSTATS 来 更 新 统计 , 然后 通过 REBIND 重新 绑 定 静态 SQL 
语句 ， 以 使 DB2 优化 器 能 够 得 到 最 新 最 准确 的 信息 。 

(7) 离线 REORG 中 途 失 败 ， 有 可 能 导致 索引 数据 的 损坏 ， 因 此 尽量 不 要 强行 终止 正在 运 
行 的 离线 REORG 操作 。 


A 注 意 : 自动 维护 BN 

除了 手工 维护 外 ，DB2 也 支持 自动 维护 ， 包括 自动 统计 信息 收集 

( AUTO RUNSTATS ). 自动 碎片 整理 (AUTO REORG ) 和 自动 备份 (AUTO BACKUP). 

DBA 可 以 根据 自己 的 实际 情况 来 定义 维护 窗口 政策 文件 (格式 为 XML )， 随 后 调用 

存储 过 程 AUTOMAINT SET POLICYFILE 和 AUTOMAINT GET POLICYFILE 分 别 进 
行政 策 文 件 的 设置 和 获取 。 


7.2.3 随机应变 一 一 重新 绑 定 


当 重 新 收集 统计 信息 之 后 ，DB2 优化 亏 会 根据 最 新 的 信息 调整 执行 计划 ， 后 续 碍 询 纺 详 将 
使 用 新 统计 信息 。 但 是 对 于 裔 态 语句 ， 束 像 得 到 作战 指令 已 经 派出 的 部 队 ， 如 果 不 重 新 发 布 指 
令 ， 征 不 会 起 作用 的 。 类 似 的 ， 当 数据 库 的 执行 环境 发 生变 化 时 ， 例 如 对 该 静态 SQL 访问 的 表 
上 增加 了 索引 ， 由 于 议 态 SQL 不 会 重新 生成 访问 计划 ， 融 不 会 使 用 该 索引 ， 从 而 达 不 到 最 佳 的 
执行 效率 ， 这 个 时 候 就 需要 进行 重新 绑 定 (REBIND) 来 适应 环境 的 变化 。 
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比较 : 动态 SQL 和 静态 SQL 的 区 别 


在 DB2 中 ,动态 SQL 语句 是 在 应 用 程序 运行 时 被 编译 和 执行 的 ， 而 静态 SQL 语句 的 编 
译 是 在 应 用 程序 运行 前 进行 的 ， 编 译 的 结果 会 存储 在 DB2 的 包 (PACKAGE) 中 。 当 程序 运行 
时 ， 数 据 库 将 直接 执行 编译 好 的 SQL 语句 ， 降 低 运 行 时 的 开销 ， 从 而 提高 执行 效率 . 


通过 BIND 命令 ，DB2 可 以 将 静态 SQL 语句 的 执行 计划 重新 绑 定 ,这样 在 执行 的 时 候 ， 右 
会 按照 保存 在 包 中 的 访问 计划 执行 ， 避 免 了 重复 的 编译 和 访问 计划 的 生成 。 

对 于 SQC CX CO 等 程序 ,在 BIND 的 时 候 会 创建 一 个 包含 静态 SQL 的 包 。 而 存储 过 程 
等 例 程 在 部 署 时 ， 也 会 生成 相应 的 包 。 通 过 IBM 提供 的 pureQuery 技术 ， 还 可 以 将 传统 的 动态 
SQL 绑 定 到 相应 的 包 上 ， 这 样 就 可 以 转变 为 静态 SQL 来 执行 

使 用 REBIND 命令 时 , 需要 提供 包 名 。 通过 LIST PACKAGES 命令 可 以 查看 包 名 (Package 
AD 及 相关 信息 : 


tist packages Hi 
DB2 LIST PACKAGES [FOR (USER | ALL | SYSTEM | SCHEMA schema-name)] [SHOW DETAIL] 


# 碍 看 当前 用 户 所 有 包 的 详细 信息 的 
=> db2 list packages show detail 


Package Schema Bound) by  Yalid Isolation level Blocking 
PTOAT7TTT7TS8439 DB21INST1 DB2INSTL Y CS U 
P3347436437 IDEA TEILS EUR pde AEN S Y CS U 


对 于 指定 的 单个 包 进 行 重新 绑 定 时 ， 使 用 REBIND 命令 


=> b2 rebin package DBA2TNSTICPTOSTTZTyS4S39 
DB20000I The REBIND PACKAGE command completed successfully. 


但 是 如 果 对 所 有 的 包 重 新 绑 定 ， 就 需要 使 用 db2rbind 命令 了 了。 


[dobo2insti@db2? 13 dob2rbind samole =1 db2rbincd.log all 
Rebind done successfully for database 'SAMPLE'. 


动态 SQL 在 执行 时 编译 ， 其 编译 结果 也 会 存储 到 包 绥 存 (PACKAGE CACHE) 中 。 当 更 
新 了 统计 信息 时 ， 要 使 缓存 中 的 动态 语句 使 用 最 新 的 统计 信息 ， 可 以 通过 FLUSH PACKAGE 
CACHE DYNAMIC 更 新 包 缓存 。 


7.3 ”数据 移动 工具 


在 战争 中 ， 人 快速 转移 部 队 的 能 力 通 向 是 致胜 的 法 至 乙 一 ， 对 于 数据 库 来 说 ， 快 速 地 移动 数 
据 同伴 全 天 重要 。 儿 对 个 同 的 应 用 场景 ，DB2 提供 了 如 表 7-2 Drs ILE 
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表 7-2 数据 移动 的 工具 


命令 功能 特点 
EXPORT 使 用 人 简单， 但 速度 较 慢 
IMPORT 将 EXPORT 导出 的 文件 导入 到 数据 | 速度 较 慢 ， 使 用 比较 简单 ， 会 激发 相应 
库 中 的 触发 器 动作 
LOAD 将 EXPORT 导出 的 文件 或 者 游标 中 | 速度 很 快 ， 但 是 使 用 较 复杂 ， 不 会 激发 
的 数据 导入 到 数据 库 中 触发 器 动作 
INGEST 将 EXPORT 导出 的 文件 导入 到 数据 | 可 以 快速 移动 大 量 实时 数据 而 不 必 锁 
库 中 EHK, 在 性 能 和 可 用 性 之 间 做 到 了 
极 好 的 平衡 
db2move 和 EXPORT, IMPORT, LOA, COPY | 批量 复制 对 象 和 数据 
等 选项 配合 使 用 能 够 在 数据 库 间 批 
量 移 动 或 复制 大 量 的 数据 库 对 象 
db2relocatedb 更 改 数据 库 名 称 或 重 定 位 数据 库 或 | 通过 更 改 数据 库 元 数据 实现 ， 只 能 离线 
者 数据 库 的 组 件 操作 
ADMIN MOVE | 在 线 或 离线 移动 表 只 能 在 同一 数据 库 内 移动 
TABLE 
ADMIN COPY 批量 复制 对 象 只 能 在 同一 数据 库 中 复制 
SCHEMA 


7.3.1 导出 数据 (EXPORT) 


EXPORT 命令 简单 来 讲 耽 是 通过 得 询 语句 选择 要 导出 的 数据 并 保存 到 DEL. IXF 和 WSF 
等 格式 的 文件 中 。 接 下 来 ， 看 看 如 何 使 用 EXPORT 命令 导出 数据 。 

如 下 所 示 ，OF DEL 指明 了 要 将 数据 输出 到 DEL 格式 的 文件 EMPLOYEE RESUME 
PHOTO.DEL 中 ， 而 LOBS 类 型 数据 导入 到 路 径 /datal/lobs 和 /data2/lobs 目录 下 ，XML 数据 导 
入 到 /data3/xml 和 /data4/xml 目录 下 ， 并 将 导出 过 程 中 的 消息 存 入 消息 文件 msg.out 中 。 

(db2inst1@do2 ~] Sdobo2 "EXPORT TO EMPLOYEE RESUME PHOTO. DEL OF DEL LOBS TO 
/datal/lobs,/data2/lobs XML TO /data3/xml,/data4/xml MESSAGES msg.out SELECT 


R- nha Mss dese RESUME FORMAT, R- RESUME, P- PHOTO FORMAT, P-o PICTURE PROM EMP RESUME R; EMP PHOTO 
P WHERE R.EMPNO-P.EMPNO" 


Number of rows exported: 16 


从 上 面 的 例子 可 以 看 出 EXPORT I) 4 H] JE fij t, TH Ze Vr AR LUGD 7 75453E4€ | EXPORT 
的 使 用 , 在 实际 的 应 用 中 必然 会 遇 到 种 种 问题 ， 下面 就 是 一 些 使 用 EXPORT 命令 的 注意 事项 与 
技巧 。 
(1) 使 用 EXPORT 命令 ， 必 须 具 有 相应 权限 。 由 于 导出 操作 需要 使 用 SELECT 语句 ， 
此 使 用 EXPORT 命令 需要 有 SYSADM 或 者 DBADM 管理 权限 ， 或 者 对 导出 的 表 有 CONTROL 
或 SELECT 特权 。 
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(2) 使 用 EXPORT 命令 可 以 导出 多 种 文件 格式 ， 但 每 种 格式 都 有 各 日 的 特点 ， 如 果 和 需要 
在 导出 数据 的 同时 也 导出 表 的 定义 ， 需 要 选择 IXF 格式 ， 使 用 这 种 格式 导出 的 文件 ， 在 导入 的 
时 候 ， 如 果 目 标 表 不 存在 ， 可 以 目 动 创 建 相 应 的 目标 表 。 通 常 这 种 格式 导出 的 文件 在 导入 时 ， 
效率 比 其 他 格式 要 高 。 而 其 他 文件 格式 则 只 能 导出 相应 的 数据 ， 导 入 时 , 目标 表 必 须 实 际 存在 。 

(3) 要 提高 导出 数据 的 效率 ， 必 须 从 两 方面 看 手 ， 首 先 ， 过 滤 数 据 的 三 询 语句 的 效率 直 
接 决 定 了 导出 数据 效率 ， 因 此 必须 优化 查询 语句 ， 其 次 对 于 大 数据 和 XML 数据 ， 可 以 指定 多 
个 文件 路 径 并 行 导 出 ， 从 而 提高 效率 。 

(4) 另外 EXPORT 是 基于 三 询 的 导出 ， 其 导出 数据 必须 经 过 数据 库 引 擎 ， 当 寻 出 海量 数 
据 时 ， 其 导出 数据 的 效率 是 有 局 限 性 的 ， 那 有 没有 什么 办 法 和 直接 从 数据 文件 抽取 数据 呢 ， 答 案 
是 肯定 的 ，High Performance Unload 吏 是 这 样 一 和 款 工 具 ， 它 不 需要 经 过 数据 库 引 擎 ， 直 接 从 数 
据 库 文件 中 抽取 数据 ， 从 而 能 够 以 数 倍 于 EXPORT 的 速度 导出 海量 数据 。 


7.3.2 导入 数据 (IMPORT ) 


DB2 中 导入 数据 的 方法 在 DB2 V10 以 前 主要 有 2 种 ， 一 种 是 IMPORT， 为 一 种 是 LOAD。 
IMPORT 相对 于 LOAD 来 说 比较 简单 ， 可 以 理解 为 EXPORT 的 逆 过 程 。 在 这 里 ， 先 重点 介绍 
IMPORT 命令 的 使 用 方法 。 

IMPORT 命令 使 用 INSERT 语句 来 批量 插入 数据 ， 因 此 ，IMPORT 会 遵循 INSERT 语句 的 
各 种 限制 ， 例 如 在 插入 时 需要 验证 各 种 约束 、 触 发 器 和 参照 完整 性 检查 等 。 

我 们 首先 看 一 下 IMPORT 命令 格式 : 

IMPORT FROM filename OF (IXE | ASC | DEL | WSF] 

LOBS FROM lob-path | (,lob-path) ... ] ] 
XML FROM xml=-patn erectae o ab T.) »»o»o | ] [MODIFIED BY Selle p eT ON 


METHOD eel eee ne cocrPbecodecmdg ec ) 
NULL INDICATORS (col=position eco o s peor) )| | 


[ 

[ 

[ 

[ 

内 ( col=-name | 了 二 三 让 BE c E 

PE ( col-position | 1, COl=position? səsə | JP] 

OMLPARSE {STRIP | PRESERVE) WADTTESPACE |] 

[XMLVALIDATE USING {XDS [DEFAULT schema-sqlid] 

MENOREM Eeen e e LIQ | S CES ena) 

[MAP ((schema=s@licl, schema=salic)h I 1 (schema=salic, sechema=salic)h m 
SCHEMA schema-sqlid | SCHEMALOCATION HINTS }] 

[ALLOW {NO | WRITE} ACCESS] 

[COMMI TCOUNT n | AUTOMATIC} [{RESTARTCOUNT | SKIPCOUNT} ni 

[ROWCOUNT n] [WARNINGCOUNT n] [NOTIMEOUT] [MESSAGES message-file] 

{ (INSERT | INSERT UPDATE | REPLACE | REPLACE CREATE ) 

INTO {table=-name 下 人 insgert=columm ol | hierarcnhy=-cesceription)} 

| CREATE INTO {table=name |( insert=columa ; sso DI 
hierarchy-description {AS ROOT TABLE | UNDER sub-table-name} 

[IN tablespace-name [INDEX IN tablespace-name] [LONG IN tablespace-name]]} 


IMPORT 所 支持 的 导入 文件 类 型 包括 ASC, DEL. IXF 和 WSF. Œ IMPORT 过 程 中 产生 
的 消息 记录 在 message file 中 。target table name 指定 了 目标 表 的 名 字 。 
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1. 导入 方式 选项 


我 们 可 以 通过 不 同 选项 来 决定 导入 数据 的 方式 : 

(1) INSERT 选项 : 表示 导入 数据 时 不 影响 已 经 存在 的 数据 ， 如 果 导 入 的 行 与 已 存在 行 有 
主键 冲突 ， 则 本 行 不 插入 。 

(2) INSERT UPDATE 选项 : 此 选项 只 针对 有 主键 的 表 ， 在 导入 数据 时 需要 比 对 主键 ， 
主键 重复 的 话 束 update( 用 新 数据 巷 挥 原 数 据 ，， 否则 束 insert (直接 搬入) 。 例 如 : X test tab, 
id 字段 为 主键 ， 要 更 新 的 字段 为 name。 要 导入 的 文件 内 容 为 : 


LOL, "Jonm! 
102, "TOM" 


叶 入 语句 是: 


IMPORT FROM memoer.del OF DEL insert update into test tab 


如 果 test tab 表 中 已经 有 一 行 数 据 的 id 字段 值 为 101, 那么 这 行 数据 的 name 束 会 被 更 新 为 

John。 如 果 没 有 id 字段 值 为 101 的 行 , 那么 直接 执行 insert 操作 , 插入 一 行 数据 (id=101, name= 
*John" ) 。 

(3) REPLACE 选项 : 表示 删除 擅 所 有 已 经 存在 的 行 ， 并 导入 新 的 数据 。 既 然 会 删 挥 原 有 
的 数据 ， 那 么 这 个 操作 是 有 风险 的 ， 使 用 时 需要 注意 。 

(4) REPLACE CREATE 选项 : 如 果 目 标 表 存在 ， 则 与 REPLACE 选项 一 样 ， 如 条 目标 表 
未 定义 ， 则 建立 目标 表 及 索引 ， 使 用 这 个 选项 的 前 提 是 导入 文件 为 PC/IXF 格式 。 

(5) CREATE 选项 : 建立 目标 表 及 索引 ， 并 导入 数据 ， 使 用 这 个 选项 的 前 提 是 导入 文件 
为 PC/IXF 格式 。 


. 导入 时 的 权限 要 求 


用 户 需 要 注意 : 使 用 IMPORT 命令 需要 SYSADM 或 者 DBADM 管理 权限 ， 或 者 对 要 导入 
的 表 或 视图 拥有 SELECT. INSERT, CONTROL 或 CREATETAB 特权 。 


3. 并 发 控制 选项 


在 IMPORT 时 ， 默 认 并 发 控制 选项 是 ALLOW NO ACCESS， 也 就 是 说 ， 要 对 表 加 上 互 斥 
S CO ， 因 此 ， 在 导入 过 程 中 ， 表 数据 是 不 能 读 写 的 。 如 果 和 希望 在 导入 过 程 中 对 表 可 以 读 写 ， 
则 需要 使 用 ALLOW WRITE ACCESS 选项 , 这 时 对 表 加 IX 锁 。 使 用 ALLOW WRITE ACCESS 
选项 ， 即 使 没有 设置 COMMITCOUNT， 其 行为 也 会 和 设置 了 COMMITCOUNT AUTOMATIC 
一 样 。 需 要 注意 的 是 ， 如 果 导 入 选项 使 用 的 是 REPLACE、CREATE 或 者 REPLACE CREATE, 
则 不 能 使 用 ALLOW WRITE ACCESS 选项 。 


4. 提交 时 机 选项 


使 用 IMPORT 意味 看 执行 批量 记录 的 插入 操作 , 默认 情况 下 这 些 批量 插入 操作 是 在 一 个 事 
务 内 进行 的 。 由 于 在 事务 执行 过 程 中 会 生成 大 量 的 在 线 日 志 ， 因 此 需要 保证 足够 的 在 线 日 志 空 
间 ; 另外 ， 在 插入 过 程 中 会 申请 大 量 锁 资 源 ， 可 能 导致 锁 升 级 。 为 了 避免 这 种 情况 ， 可 以 使 用 
COMMITCOUNT 选项 指定 插入 多 少 条 记录 就 提交 一 次 ， 或 者 使 用 COMMITCOUNT 
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AUTOMATIC 选项 来 由 IMPORT 自己 决定 提交 时 机 。 男 外 , ROWCOUNT 选项 被 用 来 标明 要 导 
入 多 少 行 数据 。 

在 下 面 的 例子 中 ， 每 插入 1000 条 数据 就 提交 一 次 。 如 果 在 IMPORT 过 程 中 失败 ， 可 以 查 
看 msg.out 文件 ， 找 到 最 后 一 个 插入 成 功 并 且 已 经 提交 的 记录 ， 随 后 再 继续 IMPORT 的 时 候 使 
用 选项 RESTARTCOUNT， 从 失败 的 记录 开始 继续 导 


IE 全 下 二 EECIEIGIIES c OH 
COMMITCOUNT 1000 
MESSAGES msg.out 
INSERT INTO CUSTOMEY 


如 果 使 用 RESTARTCOUNT 20000 跳 过 前 20000 条 数据 继续 导入 , 用 ROWCOUNT 选项 指 
定 要 导入 30000 条 数据 ， 采 用 的 命令 如 下 所 示 : 


IMPORT FROM myfile.ixf OF IXF 
COMMITCOUNT 1000 RESTARTCOUNT 20000 ROWCOUNT 30000 
MESSAGES msg.out 
INSERT INTO newtable 


5. 导入 数据 时 代码 页 的 选择 


最 后 ， 来 看 一 个 比较 综合 的 例子 ， 比 如 已 丝 有 一 个 从 数据 库 里 导出 的 文件 employee.del， 
它 使 用 的 代码 页 为 1386， 一 共 42 行 数 据 。 执 行 下 面 的 导入 操作 : 


[do2insti8db2 ~] $db2 "IMPORT FROM employee.del OF DEL MODIFIED BY codepage-1208 
dateforma 
p-cwvUYYYYMMDDNV'" METHOD OP (CF 2 11, 312) Arron NO ACCESS COMMETCOUNT AUPOMATTC RES 


TARTCOUNT 41 ROWCOUNT 1 MESSAGES msg.out INSERT INTO myemployee (EMPNO, FIRSTNME 
; BIRTHDATE, SALARY)" 


Number of rows read = 42 
Number of rows skipped = 41 
Number of rows inserted = 1 
Number of rows updated = 0 
Number of rows rejected = 0 
Number of rows committed = 42 


上 上 面 的 导入 操作 中 , 通过 METHOD P 指定 只 导入 文件 中 的 第 1、2、11 和 12 FR, ALLOW 
NO ACCESS 表示 导入 过 程 中 不 能 读 写 ，COMMITCOUNT AUTOMATIC 表示 提交 频率 由 系统 
决定 ， 此 次 将 跳 过 前 41 行 ， 而 从 42 行 开 始 导 入 ，ROWCOUNT 表示 只 导入 一 行 。 接 着 再 看 
MODIFIED BY 里 和 面 的 选项 ，codepage=1208 表示 导入 文件 的 代码 页 是 1208, dataformat- 
YYYYYMMDDY 表明 了 导入 文件 中 日 期 字段 的 格式 。 目 前 看 来 一 切 正常 ， 最 后 来 看 一 下 导入 后 
的 表 内 容 : 


Wello mms Ne ~] $dob2 select * from enmplevee 


EMPNO FIRSTNME BIRTHDATE SALARY 


200340 1956705717 51840.00 


1 record(s) selected. 
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从 结果 看 确实 成 功 地 导入 了 一 行 数据 。 不 对 ! FIRSTNME 字段 怎么 没有 值 ? 仔细 看 导入 命 
令 就 会 及 现 问题 出 在 codepage=1208 上 ， 还 记得 导出 文件 使 用 的 代码 页 是 1386 吗 ? 其 实 ，DB2 
本 身 具 备 将 导入 文件 代码 页 转化 为 目 喘 代码 页 的 能 力 ， 但 前 提 是 要 告诉 它 导 入 文件 的 芮 实 代 码 
页 ， 否 则 ， 导 入 后 会 出 现 尝 段 值 错 误 或 者 乱码 现象 。 这 次 把 导入 命令 中 的 codepage 修改 为 1386 
乙 后 再 次 执行 : 

[db2insti8db2 ~]S$dp2 "IMPORT FROM employee.del OF DEL MODIFIED BY codepage-1386 
dateforma 

E=\UYYYYMMDD\ METHOD BP C1, 2 1:1, 12) ALON NO ACCESS COMMTILCOUNT AUTOMATICI RES 


TARTCOUNT 41 ROWCOUNT 1 MESSAGES msg.out INSERT INTO myemployee (EMPNO, FIRSTNME 
; BIRTHDATE; SALARY)" 


Number of rows read = 42 
Number of rows skipped = 41 
Number of rows inserted —-] 
Number of rows updated = 0 
Number of rows rejected = 0 


Il 
心 
DD 


Number of rows Commit el 


A PE EY IR] ARD NA SUE BAI ETT. 
lab2insti@db2 $0520 select 六 from venplovee 
EMPNO  FIRSTNME BIRTHDATE SALARY 


200340 XIJ gos gsx 31840.00 


1 record(s) selected. 


通过 上 面 的 例子 ， 笔 者 的 建议 是 在 导出 导入 时 显 式 指定 codepage， 从 而 把 命运 掌握 在 自己 
手 里 。 这 一 点 在 路 服务 器 导出 导入 的 场景 中 尤为 重要 。 当 然 ， 如 果 系 统 编 侣 相对 单一 时 ， 也 可 
以 通过 db2set db2codepage 将 默认 值 更 改 为 所 需要 的 编 合 ， 从 而 避免 每 次 都 需要 重复 指定 。 


7.3.3 LOAD 一 一 导入 大 数据 的 核武 器 


如 果 说 IMPORT 是 导入 数据 的 常规 武器 ,那么 LOAD 就 是 导入 数据 的 核武 器 ,对 于 OLAP 
系统 ， 耐 对 TB 级 的 数据 时 ，IMPORT 残 很 难 满 足 性 能 的 需求 ， 这 个 时 候 就 是 LOAD KEH F 
KST. LOAD 导入 与 IMPORT 不 同 ， 它 并 不 是 通过 SQL 语句 INSERT 进行 导入 ， 而 是 把 
导入 数据 以 数据 页 的 形式 直接 存 入 数据 库 中 。 这 就 意味 着 摆脱 了 SQL 语句 的 束缚 ， 以 一 种 物理 
方式 把 数据 放 入 数据 库 中 ， 并 且 在 导入 过 程 中 不 记录 日 志 或 者 只 记录 少量 的 日 志 ， 特 别 适 合 大 
数据 量 导 入 。 如 图 7-1 所 示 ，LOAD 在 导入 过 程 中 只 进行 唯一 性 检查 和 非法 值 检查 ， 不 会 进行 
完整 性 检 查 ， 不 会 调用 触发 器 ， 这 些 旬 辑 层面 的 约束 检查 需要 在 导入 之 后 手动 执行 SET 
INTEGRITY 命令 进行 检查 ， 因 此 对 于 存在 约束 定义 的 表 ， 在 导入 后 别 态 了 还 需要 约束 检查 这 
22 y 


LOAD 导入 的 流程 如 图 7-1 所 示 : 
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数据 库 表 


数据 页 数据 页 
010010 101101 
100110 010101 
101110 111111 


数据 页 数据 页 
110101 000011 
010001 111110 
110000 011001 

EC e HE = nb 
25 ee 数据 页 数据 页 
KIE mea 001010 001010 
SE 101001 101001 


010000 010101 


E 7-1 LOAD 导入 示意 图 


LOAD 支持 的 数据 格式 包括 DEL. ASC, PC/IXF 和 CURSOR， 其 中 CURSOR 只 能 用 在 
LOAD 而 不 能 用 在 IMPORT， 下 一 市 将 具体 介绍 LOAD FROM CURSOR. 


1. 使 用 LOAD 命令 导入 数据 


下 面 先 通过 一 个 例子 来 学 习 如 何 用 LOAD 进行 导入 。 继 续 使 用 IMPORT 中 用 到 的 导入 文 
fF employee.del， 只 是 这 次 改 用 LOAD， 操 作 结 果 如 下 : 


—»db2 "LOAD FROM employee.del OF DEL MODIFIED BY codepage-1386 dateformat- 

XO vocY MIMITOID NC TDI MEETS BIS CS Fo ad vemps emp METHOD P (1, 2, 11, 12) MESSAGES msg out T 
EMPFILES PATH c:\load INSERT INTO myemployee (EMPNO, FIRSTNME, BIRTHDATE, SALARY 
) FOR EXCEPTION empexp NONRECOVERABLE INDEXING MODE REBUILD ALLOW NO ACCESS" 


Number of rows read = 42 
Number of rows skipped = 0 
Number of rows loaded = 42 
Number of rows rejected = 0 
Number of rows deleted = 0 
Number of rows committed = 42 


上 面 例子 中 大 部 分 选项 和 IMPORT 导入 是 一 样 的 。 需要 注意 的 是 ， 在 LOAD 导入 中 可 以 
指定 DUMPFILE, DUMPFILE 用 来 存放 在 导入 过 程 中 的 无 效 数 据 行 。 由 于 在 导入 过 程 中 还 会 产 
生 违 例 ， 违 例 表 由 选项 FOR EXCEPTION 决定 ， 它 是 用 户 定 义 的 表 ， 用 来 存放 违反 唯一 性 约束 
的 行 。 其 表 结 构 包 括 所 有 目标 表 的 列 、 一 个 记录 该 行 插 入 时 间 的 时 间 戳 列 和 一 个 存放 违例 原因 
的 CLOB 列 。 上 例 中 违例 表 为 empexp， 是 在 LOAD 之 前 事先 建立 好 的 。 建 立 过 程 如 下 : 


=>db2 "CREATE TABLE empexp AS (SELECT myemployee.*, CURRENT TIMESTAMP AS T 
IMESTAMP, cast ('' AS CLOB (32K)) AS MSG FROM myemployee) WITH NO DATA" 
DB20000I The SQL command completed successfully. 


另外 ， 在 上 面 的 LOAD 实例 中 还 使 用 了 一 些 在 IMPORT 中 没有 见 过 的 选项 ， 接 下 来 就 深 
入 研究 一 下 LOAD 的 儿 个 重要 选项 ， 从 而 使 大 家 对 LOAD 有 一 个 更 全 面 的 认识 。 
(1) LOAD 文 持 的 加 载 方 式 
LOAD 的 加 载 模式 和 上 一 节 介 绍 的 IMPORT 类 似 。 
e INSERT: 直接 插入 数据 而 不 影响 原 有 的 数据 。 
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e REPLACE: 删除 掉 所 有 现 有 数据 ， 然 后 导入 新 的 数据 ， 这 个 选项 还 要 求 对 相关 的 表 有 
DELETE 特权 。 

e TERMINATE: 当 LOAD 操作 出 现 异 单 时 ， 可 以 用 LOAD…TERMINATE 操作 来 终止 
LOAD 操作 ， 并 且 系 统 会 日 动 将 被 导入 的 表 回 深 至 导入 前 的 状态 。 

e RESTART: 用 来 重启 被 终止 的 LOAD 操作 。 将 从 最 后 一 个 一 致 点 〈 导 入 成 功 的 点 ) 开 
台 ， 继 续 未 完成 的 操作 。 为 了 获取 最 后 一 个 一 致 点 ，LOAD 会 恋 取 之 前 生成 的 各 种 文 
件 ， 了 解 之 前 的 导入 进度 和 状态 。 用 户 可 以 通过 TEMPFILES PATH 指定 临时 文件 存放 
位 置 ， 如 果 在 LOAD 命令 中 不 进行 指定 ，LOAD 会 自动 创建 并 保存 在 当前 目录 中 。 在 
导入 成 功 后 ， 这 些 临时 文件 会 目 动 被 删除 。 

(2) LOAD 文 持 的 索引 模式 

很 多 人 对 LOAD 导入 过 程 中 索引 的 使 用 有 误区 ， 其 实 这 可 以 通过 INDEXING MODE 来 指 
定 导 入 过 程 中 如 何 处置 索 引 ， 文 持 的 模式 包括 : 

e REBUILD 模式 : 重建 所 有 索引 。 

e INCREMENTAL 模式 : 在 导入 的 同时 对 现 有 索引 进行 增 量 维护 而 不 是 重建 。 

e AUTOSELECT fix: 由 LOAD 依据 索引 的 深度 来 目 动 选 择 是 采用 REBUILD 还 是 

INCREMENTAL 方式 。 

e DEFERRED 模式 : 在 LOAD 过 程 中 把 涉及 到 的 索引 标记 成 需要 重建 ， 一 般 在 数据 库 重 
新 激活 后 或 者 第 一 次 使 用 时 再 真 正 进行 重建 。 

(3) LOAD 文 持 的 并 发 机 制 

E LOAD 过 程 中 ， 会 涉及 到 表 的 并 发 访问 问题 。LOAD x: fF ALLOW NO ACCESS 和 READ 
ACCESS ONLY 两 种 方式 。 

e ALLOW NO ACCESS 选项 : 默认 情况 下 ，LOAD 使 用 该 选项 ， 在 导入 过 程 中 对 表 加 互 

F (X) 。 

e READ ACCESS ONLY 选项 : 使 用 该 选项 ， 在 导入 过 程 中 对 表 加 共 圣 锁 (S) ， 对 于 已 
经 存在 的 数据 是 可 读 的 ， 但 是 新 导入 的 数据 必须 在 导入 结束 以 后 才 可 以 访问 。 

AIh XT LOCK WITH FORCE: 如 末 某 个 应 用 和 LOAD 发 生 锁 冲突 而 使 LOAD 处 于 等 
REIS. LOAD 必须 要 等 每 应 用 释放 掉 需 要 的 锁 ， 如 下 使 用 LOCK WITH FORCE 选项 ， 
LOAD 会 强制 其 他 应 用 释放 上 所 需要 的 锁 ， 这 有 点 像 force applications. 

(4) LOAD 对 数据 可 恢复 性 的 影 啊 

在 生产 系统 中 为 了 保证 数据 库 的 可 恢复 性 ， 将 数据 库 置 于 归档 模式 是 更 加 安全 的 方式 。 但 
是 ， 用 LOAD 导入 数据 时 不 记录 日 志 ， 虽 然 这 样 会 对 导入 速度 有 好 处 ， 不 过 这 也 会 产生 问题 ， 
如 果 需 要 前 滚 恢复 怎么 办 ?数据 库 不 可 恢复 怎么 办 ? 为 了 解决 这 个 问题 , 在 LOAD 中 可 以 指定 
一 些 选 项 来 保证 数据 库 的 可 恢复 性 。 

LOAD 中 有 关 可 恢复 性 的 选项 有 如 下 几 种 : 

e COPY NO: 这 是 默认 选项 ， 使 用 这 个 选项 会 导致 表 裤 间 处 于 BACKUP PENDING 状态 

( 待 备份 状态 ) ， 导 入 结束 以 后 需要 对 表 空 间 进 行 一 次 备份 。 相 当 于 需要 通过 人 为 手 
段 来 保证 数据 库 的 可 恢复 性 。 
e COPY YES: 建立 一 个 导入 数据 的 备份 介质 。 在 前 滚 恢复 阶段 ， 会 用 这 个 备份 介质 恢复 
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LOAD 导入 的 数据 ， 相 当 于 目 动 保证 数据 库 的 可 恢复 性 。 
e NONRECOVERABLE: 表明 此 表 是 不 能 进行 前 滚 恢复 的 ， 如 果 进 行 前 滚 恢复 ， 此 表 会 
进入 Unavailable 状态 。 


2. 你 所 要 知道 的 LOAD 的 四 个 阶段 


X 


AT 


如 果 要 用 好 LOAD. Wim Jf LOAD 的 内 部 机 制 ， 首 先 应 该 了 解 LOAD 过 程 中 的 不 同 
阶段 。LOAD 过 程 包 含 装 载 、 构 建 、 删 除 和 索引 复制 4 个 阶段 ， 这 4 个 阶段 是 按 顺 序 发 生 的 ， 
在 一 个 阶段 结束 后 才 进入 下 一 个 阶段 。 在 LOAD 的 过 程 中 ， 如 果 目 标 表 不 包含 唯一 性 索引 ， 则 
不 会 执行 完整 的 4 个 阶段 ， 和 否则 就 进行 完整 的 4 个 阶段 。LOAD 的 过 程 如 图 7-2 所 示 : 


导入 阶 导入 阶 ” 建立 阶 建立 阶 删除 阶 删除 阶 索引 复 ss 
段 开始 段 结束 ”上段 开始 BAR 段 开 始 BÆR 制 阶段 ” 制 阶段 


图 7-2 LOAD 阶段 示意 图 


(1) 导入 阶段 
在 此 阶段 完成 数据 的 导入 ， 并 收集 表 和 索引 的 统计 信息 。SAVECOUNT 选项 决定 导入 多 少 
行 会 建立 一 个 一 致 检查 点 , 导入 的 消息 被 记录 到 MESSAGE 文件 中 。 如果 导 入 中 断后 重 狐 开始 ， 
LOAD 会 从 最 近 一 次 一 致 检查 点 开始 导入 。 如 果 存 在 非法 的 行 ， 比 如 违反 非 空 约束 的 行 或 者 格 
式 完 全 不 对 的 行 ， 则 该 行 会 被 记录 到 DUMPFILE 中 。 
(2) 建立 阶段 
如 果 导 入 表 有 索引 的 话 ， 根 据 INDEXING MODE 的 设 定 建 立 相 应 索引 。 如 果 在 LOAD 中 
指定 了 STATISTICS USE PROFILE， 则 会 收集 索引 的 统计 信息 。 
(35) 删除 阶段 
有 人 会 问 ， 不 是 导入 数据 了 么 ， 为 什么 还 要 再 来 个 删除 阶段 呢 ? 要 知道 ， 由 于 LOAD 操作 
在 导入 效率 上 实 属 “ 批 量 ” 的 IMPORT 操作 ， 速 度 很 快 ， 也 就 难免 导入 的 数据 中 “鱼龙混杂 ”。 
这 个 删除 阶段 ， 就 是 要 把 违反 唯一 性 约束 或 主键 约束 的 行 〈 比 如 导入 员工 信息 ， 出 现 两 个 人 的 
刁 份 证 号 但 是 一 样 的 ) 从 表 中 删除 ， 并 放 到 违例 表 〈Exception Table) 中 。 如 果 未 指定 违例 表 ， 
则 违例 行 被 直接 删除 ， 并 且 不 留 下 任何 追踪 记录 。 
Æ LOAD 失败 时 , 我 们 可 以 通过 MESSAGE 文件 调查 导入 时 被 拒绝 的 原因 ,并且 对 违例 表 
中 的 行进 行 相应 修改 ， 然 后 用 INSERT 语句 重新 把 违例 表 中 的 行 插入 到 目标 表 中 。 
如 果 LOAD 在 删除 阶段 失败 ， 可 以 使 用 RESTART 选项 重新 LOAD。 另 外 ， 在 删除 阶段 是 
记录 日 忘 的， 因此 如 果 有 大 量 的 违例 行 ， 可 能 会 有 日 志 空 间 满 的 风险 。 
(4) 索引 复制 阶段 
如 果 指 定 了 ALLOW READ ACCESS 并 且 在 LOAD 中 使 用 了 系统 临时 表 空 间 , 则 在 这 个 阶 
段 会 将 索引 从 系统 临时 表 空 间 复 制 到 原 表 空间 。 在 复制 阶段 ， 目 标 表 会 被 设 定 为 离线 状态 ， 不 
能 访问 。 
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3. LOAD 过 程 中 表 的 状态 以 及 应 对 方法 


Æ LOAD 过 程 中 , 涉及 到 的 表 会 处 于 各 种 状态 ,通过 这 些 状态 对 数据 的 访问 进行 限制 和 完 
整 性 保护 。 这 样 ， 当 LOAD 出 现 问 题 时 ， 吏 能 知道 发 生 了 什么 ， 并 且 知 道 如 何 把 表 恢 复 到 可 用 
状态 。 

那么 如 何 奏 询 表 的 状态 呢 ? 其 实 很 容易 ， 上 只 需要 执行 LOAD QUERY Wa AER. HP 
table name 是 目标 表 名 : 


LOAD QUERY TABLE table name 


下 面 束 来 介绍 一 下 LOAD 的 各 种 状态 : 

(1) Normal: 正常 状态 ,一般 刹 建 的 表 都 是 这 种 状态 。 

(2) Load in Progress: 当 表 正在 进行 LOAD 时 ， 会 处 于 这 个 状态 。 

(3) Load Pending: 当 表 在 LOAD 过 程 中 发 生意 外 中 断 ， 表 会 处 于 这 个 状态 ， 意 即 表 被 挂 
起 了 ， 需 要 使 用 LOAD TERMINATE, LOAD RESTART 或 者 LOAD REPLACE 命令 来 解除 这 
种 状态 。 

(4) Read Access Only: 如 果 使 用 LOAD 时 指定 了 ALLOW READ ACCESS (Kit), X 
的 状态 信息 会 包括 Read Access Only. 

(5) Unavailable: 如 来 在 LOAD 过 程 中 使 用 了 NONRECOVERABLE 选项 ， 当 使 用 LOAD 
之 前 的 某 个 时 间 点 的 数据 库 备份 进行 数据 库 恢 复 时 ,如 来 前 深 a 到 这 个 LOAD 操作 结束 后 的 某 个 
时 间 点 ， 表 便 被 置 于 Unavailable 状态 , 是 不 可 以 访问 的 。 在 这 种 情况 下 ,要 访问 这 个 表 的 数据 ， 
只 能 重新 使 用 数据 库 备 份 进行 恢 复 且 只 能 前 深 到 LOAD 操作 之 前 的 某 个 时 间 点 。 

(6) Not Load Restartable: 表 处 于 一 种 不 完整 导入 状态 ， 不 允许 使 用 LOAD RESTART 继 
续 执 行 ， 只 能 通过 LOAD TERMINATE 或 者 LOAD REPLACE 来 解除 这 种 状态 。 一 般 有 两 种 情 
况 会 导致 表 处 于 这 种 状态 ,一 种 是 LOAD 失败 , 之 后 义 前 深 恢 复 到 LOAD 之 后 的 茶 个 时 刻 ; 23 
一 种 是 在 表 处 于 Load in Progress 或 者 Load Pending 时 进行 了 在 线 备份 。 这 两 种 情况 都 会 导致 
LOAD RESTART 需要 的 相关 状态 信息 不 可 靠 ， 因 此 ，DB2 使 用 Not Load Restartable 状态 来 阻 
IE LOAD RESTART. 

(7) Unknown: 表 人 处 于 未 知 状 态 ，LOAD QUERY ZG 3X1 deo D Er) mE 
数据 库 服务 器 版 本 不 同时 才 会 出 现 这 种 状态 。 比 如 ， 如 果 使 用 一 个 DB2 V9.7 的 客户 端 去 连接 
DB2 V9.8 的 数据 库 ， 由 于 V9.8 的 表 状 态 和 V9.7 有 所 不 同 ， 如 果 表 正好 处 于 这 种 不 同 的 状态 ， 
则 使 用 LOAD QUERY 会 查询 到 Unknown 状态 。 

(8) Set Integrity Pending: 如 条 表 上 存在 约束 ， 如 参照 完整 性 约束 ， 在 使 用 LOAD 时 表 会 
处 于 这 个 状态 ， 在 LOAD 结束 后 必须 通过 执行 SET INTEGRITY 《执行 完整 性 检查 ) 使 表 摆 脱 
这 种 状态 。 

需要 指出 的 是 , 表 可 能 同时 处 于 上 述 的 多 种 状态 , 比如 , 如果 导入 时 使 用 了 ALLOW READ 
ACCESS 选项 ， 通 过 LOAD QUERY 查询 时 会 发 现 表 同时 处 于 Load in Progress 和 Read Access 
Only 状态 ， 但 Read Access Only 只 是 一 个 从 属 状 态 ， 如 果 导 入 结束 ，Read Access Only 会 目 动 
消失 。 

LOAD 之 后 如 果 需 要 解除 一 个 或 多 个 表 的 Set Integrity Pending 状态 ， 需 要 进行 相应 的 手动 
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操作 。 基 本 方法 如 下 ， 其 中 table-name 为 目标 表 名 : 


SET INTEGRITY FOR table-name IMMEDIATE CHECKED INCREMENTAL 


通过 上 面 的 命令 可 以 由 系统 立刻 进行 某 些 类 型 的 一 致 性 检查 ， 检 查 后 CONST CHECKED 
字段 的 各 字 节 会 从 N 和 变 成 ,如 有 果 检 枉 过 程 没 有 过 到 任何 违例 , 则 表 会 摆脱 Set Integrity Pending 
状态 。 如 果 检 查 过 程 中 发 现 违 例 ， 则 立刻 报错 中 止 (SQLSTATE 23514) ， 表 会 继续 保持 在 Set 
Integrity Pending 状态 。 

当然 ， 也 可 以 使 用 FOR EXCEPTION 选项 来 指定 把 违例 行 移动 到 违例 表 中 。 这 里 说 的 违例 
K (Exception Table) 和 在 前 面 有 关 LOAD 选项 中 提 到 的 违例 表 是 一 个 概念 ， 因 此 ， 可 以 复 用 
在 LOAD 中 用 过 的 违例 表 。 例 如 可 以 指定 把 SALES 表 中 的 违例 行 放 到 违例 表 sales exceptions 
中 ， 这 样 SALES 表 将 摆脱 Set Integrity Pending 状态 : 


SAT INTEGRITY FOR SALES IMMEDIATE CHECKED 
FOR EXCEPTION IN SALES USE sales exceptions 


如 果 想 要 跳 过 某 些 类 型 的 自动 约束 检查 ， 可 以 使 用 IMMEDIATE UNCHECKED 选项 。 可 
以 通过 下 面 命令 跳 过 对 表 SALES 的 外 键 检查 。 执 行 完 这 个 命令 之 后 ，CONST_CHECKED 字段 
WHEE 工会 从 N 变 成 U。 

SET INTEGRITY FOR SALES FOREIGN KEY IMMEDIATE UNCHECKED 


4. 多 分 区 环境 下 的 LOAD 


与 单 分 区 环境 相 比 ， 在 多 分 区 环境 下 ， 可 以 用 几乎 完全 相同 的 命令 来 实现 导入 ， 但 是 ， 两 
者 之 间 还 是 存在 比较 大 的 兰 开 。 

在 多 分 区 环境 下 导入 数据 一 般 有 两 个 阶段 ， 第 一 个 阶段 是 建立 阶段 ， 这 个 阶段 会 获得 导入 
需要 的 资源 ， 比 如 表 的 锁 ;， 第 二 个 阶段 是 导入 阶段 ， 数 据 将 被 导入 到 相应 分 区 的 表 中 。 

P IH HI — PU T 2 99] : 


LOAD FROM LOAD.DEL of DEL REPLACE INTO SALES 


上 面 这 条 语句 看 起 来 很 简单 ， 而 且 在 单 分 区 和 多 分 区 环境 里 的 含义 是 一 样 的 ， 都 是 把 
LOAD.DEL 里 面 的 数据 导入 到 SALES 里 。 不 过 ， 它 隐藏 了 在 多 分 区 环境 下 导入 数据 的 内 部 过 
程 ， 我 们 就 从 这 条 语句 入 手 ， 来 了 解 一 下 在 多 分 区 环境 下 导入 数据 的 特点 。 

在 多 分 区 环境 下 ，SALES 中 的 数据 可 能 分 散在 不 同 的 数据 库 分 区 , 分 区 键 决定 了 表 的 每 行 
数据 应 该 放 在 哪个 数据 库 分 区 。 这 个 工作 最 开始 由 pre-partitioning agent 进程 负责 ， 它 把 数据 分 
配 〈 这 里 基本 上 是 均匀 分 配 ) 给 不 同 分 区 上 的 partition agent, partition agent 负责 把 数据 分 发 给 
各 个 分 区 的 load agent, load agent 负责 把 数据 导入 到 相应 的 分 区 。 这 里 面 涉及 到 不 同 分 区 间 的 
通信 ， 因 此 ， 在 导入 前 要 确保 数据 库 管 理 需 参数 svcename 和 DB2COMM 数据 库 环 境 变 量 设置 
正确 。 

各 个 agent 之 间 的 调用 关系 如 图 7-3 所 示 : 
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Load agent 
Partitioning | Load agent 
agent 


Partitioning 


图 7-3 多 分 区 环境 下 导入 数据 时 所 涉及 的 代理 关系 示意 图 


Pre-partitioning 
agent 


EEM SALES 表 中 导入 数据 的 命令 中 省 略 了 许多 可 选 参数 。 实 际 上 ， 在 多 分 区 环境 下 
执行 LOAD 的 时 候 ， 可 以 使 用 LOAD 提供 的 参数 PARTITIONED DB CONFIG 来 灵活 控制 ， 如 
下 所 示 : 


LOAD [CLIENT] FROM file OF IASC | DEL | IXP | CURSOR} 


{INSERT | REPLACE [{KEEPDICTIONARY | RESETDICTIONARY)] | RESTART | TERMINATE} 


INTO table=name |( insertc=columna usc beo) 


EAVES NE OBURSECIS Sor nl cb o Todes Um 
PART FILE LOCATION x 
OUTPUT_DBPARTNUMS x 
PARTITIONING DBPARTNUMS x 
MODE x 

MAX NUM PART AGENTS x 
ISOLATE PART ERRS x 
STATUS INTERVAL x 

PORT RANGE x 

CHECK TRUNCATION 

MAP FILE INPUT x 

MAP FILE OUTPUT x 

TRACE x 

NEWLINE 

DIS BITE x 

OMIT HEADER 

RUN STAT DBPARTNUM x 


下 面 讲 解 PARTITIONED DB CONFIG 提供 的 几 个 重要 参数 : 
(1) 分 区 参数 
e OUTPUT DBPARTNUMS: 用 来 决定 哪些 分 区 参与 到 LOAD 过 程 中 。 在 上 面 命令 中 没 
有 显 式 指 定 ， 即 隐 含 规定 了 包含 SALES 的 所 有 分 区 都 参与 LOAD， 需 要 注意 的 是 
OUTPUT DBPARTNUMS 只 能 设置 为 包含 导入 表 的 分 区 的 子 集 。 
e PARTITIONING DBPARTNUMS: 指定 了 哪些 分 区 负责 分 布 数据 。 上 面 命令 中 没有 显 式 
指定 , 则 由 LOAD 确定 由 多 少 分 区 以 及 在 哪个 分 区 上 局 用 partition agent 来 负 贡 分 布 数据 。 
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(2) mode 参数 
它 决定 了 导入 的 行为 ， 主 要 包括 : 
e PARTITION AND LOAD: 数据 被 同时 分 布 到 各 个 分 区 并 执行 导入 。 
e PARTITION ONLY: 数据 被 分 布 到 各 个 分 区 ， 生 成 导入 文件 ， 但 不 执行 导入 。 导 入 文 
件 包 括 一 个 文件 头 ， 摘 述 了 数据 是 如 何在 各 个 分 区 分 布 的 。 当 需要 导入 时 ， 可 以 使 用 
LOAD ONLY 选项 把 这 些 已 经 分 布 好 的 数据 导入 到 各 个 分 区 。 
e LOAD ONLY: 如 果 已 经 通过 PARTITION ONLY 把 数据 分 布 到 了 各 个 分 区 ， 这 时 可 
以 用 LOAD ONLY 选项 把 数据 导入 到 各 个 分 区 中 。 
e LOAD ONLY VERIFY PART: 如 条 数据 已 经 被 分 布 到 了 不 同 的 数据 库 分 区 ， 数 据 在 
导入 过 程 中 ， 会 对 每 行 数据 进行 验证 ， 如 果 出 现 了 违反 分 区 键 的 违例 数据 ， 这 些 数据 
被 放 到 dump 文件 中 ， 如 果 没 有 指定 dump 文件 ， 这 些 数 据 被 丢弃 ， 这 些 信 息 会 被 记录 
到 相应 分 区 的 MESSAGE 文件 里 。 
e ANALYZE: 用 来 生成 最 佳 分 布 图 《在 所 有 数据 库 分 区 之 间 均 匀 地 分 布 数据 ) 。 
如 果 像 上 面 的 命令 那样 执行 导入 ， 会 默认 使 用 PARTITION AND LOAD 模式 ， 
(3) ISOLATE PART ERRS 参数 
在 执行 LOAD 过 程 中 可 以 指定 ISOLATE PART ERRS 选项 来 控制 如 何 处 理 导入 过 程 中 的 
Hix. ISOLATE PART ERRS 一 般 情 况 下 默认 值 为 LOAD_ERRS_ONLY， 如 果 使 用 了 LOAD 
命令 的 ALLOW READ ACCESS 和 COPY YES 选项 ，ISOLATE PART ERRS 的 默认 值 则 为 
NO ISOLATION. 
ISOLATE PART ERRS 的 值 和 含义 如 下 : 
e SETUP ERRS ONLY: 如 果 在 建 并 阶段 出 现 错误 ， 例 如 分 区 、 表 空间 或 表 不 可 访问 ， 
只 有 出 错 分 区 停止 执行 , 其 他 分 区 照常 导入 。 如 果 在 导入 阶段 出 现 错误 ， 则 整个 LOAD 
操作 都 将 失败 。 
e LOAD ERRS ONLY: 如 果 在 导入 过 程 中 某 个 分 区 失败 ， 其 他 分 区 的 导入 会 继续 ， 但 
是 导入 的 数据 只 有 在 执行 LOAD RESTART 成 功 之 后 才 可 见 。 在 建立 阶段 出 现 的 任何 
错误 都 会 导致 整个 LOAD 失败 。 
e SETUP AND LOAD ERRS: 无 论 在 建立 或 者 导入 阶段 出 现 错误 ， 都 只 影响 出 错 的 分 
区 ， 其 他 分 区 照 音 执行， 但 是 导入 的 数据 在 全 部 成 功 导 入 之 前 是 不 可 见 的 。 这 个 选项 
只 能 用 在 ALLOW READ ACCESS 和 COPY YES 被 指定 的 情况 下 。 
e NO ISOLATION: 无 论 任何 阶段 的 错误 都 会 叶 八 LOAD 全 部 中 止 。 
介绍 了 这 么 多 有 关 PARTITIONED DB CONFIG 包含 的 选项 ， 再 来 看 一 个 在 LOAD 命令 中 
显 式 使 用 PARTITIONED DB CONFIG 选项 的 例子 : 


LOAD FROM LOAD.DEL of DEL REPLACE INTO SALES 
PARTITIONED DB CONFIG PARTITIONING DBPARTNUMS (3,4) 


在 这 个 例子 中 ， 从 分 区 2 执行 了 上 述 命令 ,使 用 了 PARTITIONING DBPARTNUMS 选项 ， 
它 指定 分 区 3 和 4 各 产生 一 个 partition agent 来 负责 分 布 数据 到 相应 分 区 并 进行 导入 。 相 关 进 程 
如 图 7-4 所 示 : 
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v v 
Partition Partition 
Agent Agent 


图 7-4 数据 分 发 给 3 号 和 4 号 分 区 的 代理 来 进行 导入 


接 下 再 来 看 一 个 只 分 布 数 据 而 不 导入 的 例子 ， 仍 然 从 2 写 分 区 执行 下 面 的 命令 : 


LOAD FROM LOAD.DEL OF DEL REPLACE INTO SALES 
PARTITIONED DB CONFIG MODE PARTITION ONLY 
PART FILE LOCATION /db2/data 
OUTPUT DBPARTNUMS (1,3) 


在 这 个 例子 里 指定 了 MODE PARTITION ONLY 选项 ， 代 表 只 分 布 数据 不 进行 导入 ， 
OUTPUT DBPARTNUMS (1, 3) 代表 由 分 区 1 和 分 区 3 来 负责 导入 (这 里 只 是 生成 需要 导入 
的 数据 ) ， 导 入 数据 文件 放置 在 由 PART FILE LOCATION 指定 的 /db2/data KEF, MFE F 
由 原来 导入 文件 名 字 LOAD.DEL 加 上 分 区 号 ， 比 如 /db2/data/LOAD.DEL.001。 图 7-5 展示 了 上 
述 过 程 。 


比较 : 单 分 区 和 多 分 区 下 LOAD 的 区 别 


通过 上 面 的 几 个 例子 ， 可 以 了 解 在 多 分 区 环境 下 和 单 分 区 环境 下 数据 导入 的 主要 差别 在 于 
多 分 区 环境 下 LOAD 需要 有 一 个 数据 分 布 的 过 程 。 当 然 ， 也 有 一 些 相 同 点 ， 例 如 完成 分 布 后 ， 
每 个 分 区 上 的 导入 操作 和 单 分 区 数据 库 的 导入 是 一 样 的 ， 也 是 通过 直接 装 入 数据 页 的 办 法 实现 
的 ， 例 如 在 单 分 区 上 的 一 些 命令 选项 在 多 分 区 环境 下 也 适用 ， 比 如 出 错 以 后 同样 可 以 用 
RESTART 选项 重新 执行 LOAD， 也 可 以 用 LOAD QUERY 查询 当前 表 的 LOAD 状态 。 
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Client 


Fire wall 


Database Database Database Database Database 
Partition O Partition 1 Partition 2 Partition 3 Partition 4 


LOAD 
Coordina 
tor 


LOAD-to- LOAD-to- 
file Agent file Agent 


Pre- 
| 一 一 一 一 一 一 六 一 一 一 一 一 一 一 一 一 一 一 十 一 Partition 
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5. LOAD 最 佳 实践 


图 7-5 只 


3 


布 数据 到 1 号 和 3 号 分 区 


LOAD 一 般 用 在 需要 导入 大 量 数据 的 场合 ,由 于 其 速度 远 比 IMPORT 快 ,但 是 不 当 的 LOAD 
提速 操作 ， 会 引起 性 能 问题 ， 可 能 会 使 初衷 折 回 原点 ， 甚 全 引起 事故 。 
决定 LOAD 操作 的 性 能 因素 有 多 个 ,包括 数据 量 、 索 引 数 量 以 及 导入 选项 等 .要 提高 LOAD 
的 速度 ， 一 般 在 LOAD 方法 的 性 能 相关 参数 上 做 文章 。 
(1) 单 分 区 LOAD 优化 建议 
e 大 多 数 情况 下 ， 在 LOAD 操作 期 间 对 现 有 索引 进行 增 量 维护 〈 使 用 INCREMENTAL 
选项 ) 而 不 是 重建 (使 用 REBUILD 选项 ) 更 节省 时 间 。 
e 如 果 表 上 定义 了 很 多 索引 , 增加 SORTHEAP 和 SHEAPTHRES SHR 的 大 小 , 增加 临时 
表 和 衬 间 使 用 的 缓冲 池 大 小 ， 可 提高 索引 建立 速度 。 
e 如 果 排 序 溢 出 过 多 ， 可 考虑 使 用 INDEXING MODE DEFERRED 选项 ， 以 后 再 找 机 会 
4 TUR SER 9]. 
e LOAD 在 INSERT 方式 和 REPLACE 方式 下 运行 得 一 样 好 ， 但 是 如 果 使 用 了 
REBUILD 选项 ， 用 REPLACE 方式 导入 比 用 INSERT 方式 导入 更 快 。 
e 增 大 实用 程序 堆 (UTIL HEAP SZ) 的 大 小 ， 可 以 提升 LOAD 的 速度 。 由 于 DATA 
BUFFER 代表 LOAD 所 需 的 绥 存 大 小 ， 这 部 分 绥 存 是 从 实用 程序 堆 (Utility Heap) 里 
分 配 的 ， 如 果实 用 程序 堆 的 尺寸 大 ， 那 么 DATA BUFFER 就 能 获得 足够 的 内 存 资源 。 
e 调整 DISK PARALLELISM 和 CPU PARALLELISM 的 设置 ， 可 以 提升 LOAD 的 并 行 
处 理 能 力 。DISK PARALLELISM 代表 处 理 VO 的 进程 数量 ，CPU PARALLELISM 代 
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表 处 理 格式 化 和 解析 等 任务 的 进程 数量 。 如 果 不 指 定 这 些 值 ，LOAD 将 尝试 选择 一 个 
最 优 组 合 。 

e 增 大 SAVECOUNT 的 值 。 如 果 SAVECOUNT 比较 小 ， 会 导致 数据 经 常 回 写 磁盘 ， 产 
生 大 量 IJO。 一 般 来 说 ， 最 好 还 是 把 SAVECOUNT 设 得 大 一 点 ， 毕 竟 使 用 LOAD 不 用 
像 使 用 IMPORT 一 样 担心 日 志 空 间 满 的 问题 。 

e 使 用 FASTPARSE 可 以 提高 LOAD 速度 ,使 用 FASTPARSE 文件 类 型 修饰 符 来 减少 对 
导入 数据 的 合法 性 检查 ， 通 常 性 能 可 以 提高 10% ~20%。 但 使 用 此 选项 ， 必 须 人 为 保证 
导入 数据 的 合法 性 (只 能 针对 DEL 文件 ) 。 

(2) 多 分 区 LOAD 优化 建议 

在 多 分 区 坏 境 下 ,执行 LOAD 虽然 和 在 单 分 区 环境 下 执行 有 很 多 相似 点 ， 但 是 在 分 布 数据 

方面 存在 看 比较 大 的 差 寞 。 为 了 方便 广大 读者 ， 在 这 里 分 享 一 下 多 分 区 环境 下 使 用 LOAD 操作 
的 最 佳 实践 。 

e 在 使 用 LOAD 导入 大 批量 数据 之 前 ， 首 先 用 少量 数据 进行 测试 ， 确 保 LOAD 的 各 种 选 
项 设置 正确 。 

e 如 果 想 按 导 入 文件 中 的 顺序 导入 ， 束 只 能 指定 一 个 分 区 作为 分 布 数据 的 分 区 ， 因 为 并 
行 分 布 会 给 导入 顺 厅 市 来 不 确定 性 。 在 默认 情况 下 ， 如 果 不 指定 anyorder，LOAD 只 选 
择 一 个 分 区 作为 分 布 数据 的 分 区 。 

e 如 条 需要 导入 LOB 数据 ， 那 么 要 确保 存放 LOB 数据 的 路 径 对 于 所 有 参与 导入 的 数据 
库 分 区 都 是 可 见 的 。 

e 可 以 将 ISOLATE PART ERRS 设置 成 SETUP AND LOAD ERRS 或 者 SETUP ERRS 
ONLY 来 防止 某 些 意外 错误 中 止 整个 LOAD 导入 过 程 , 从 而 让 没有 出 错 的 分 区 继续 执行 。 

e 尺 量 让 PARTITIONING DBPARTNUMS 指定 的 分 区 和 OUTPUT DBPARTNUMS 指定 
的 分 区 无 交集 ， 这 样 可 以 把 分 布 数据 和 导入 数据 的 任务 分 配 在 不 同 的 分 区 上 。 同 时 ， 
应 该 选择 在 既 没 有 分 布 工 作 ， 也 没有 导入 工作 存在 的 分 区 上 执行 LOAD 命令 ， 从 而 减 
少 CPU 的 使 用 冲突 ， 以 获得 更 好 的 导入 性 能 。 

e 多 分 区 的 统计 信息 收集 只 在 一 个 分 区 进行 ， 其 他 分 区 是 假设 数据 分 布 均匀 的 前 提 下 预 
测 出 来 的 。 Æ LOAD 过 程 中 我 们 可 以 设 定 RUN STAT DBPARTNUM 来 决定 在 哪个 分 
区 上 收集 统计 信息 。 

e 尺 量 使 用 MESSAGES 选项 保留 分 布 和 导入 时 产生 的 消息 文件 ， 便 于 在 LOAD 结束 后 
用 于 问题 退 蹊 。 


7.3.4 LOAD FROM CURSOR 轻松 移动 数据 


在 数据 量 很 大 的 情况 下 , 使 用 EXPORT 实用 程序 生成 数据 交换 文件 常 沼 要 花费 很 长 时 间 。 
另外 ， 在 把 数据 导出 和 导入 数据 库 时 ， 必 须 考 虑 不 同 的 数据 库 编码 页 。 

可 以 使 用 LOAD FROM CURSOR 命令 避免 这 些 问 题 。 当 指定 FROM CURSOR 选项 时 ， 
LOAD 直接 把 一 个 SQL 三 询 的 结果 集 做 为 数据 装载 操作 的 来 源 , 这 样式 不 需要 生成 临时 数据 交 
换文 件 。 


DB2 4&4. £3$ b 44 46 4E 46 2, 0E 


可 以 在 命令 行 上 执行 LOAD FROM CURSOR, 也 可 以 通过 使 用 DB2 的 ADMIN CMD 存储 
过 程 在 应 用 程序 或 存储 过 程 中 执行 它 。 例 如, FER LOAD FROM CURSOR 命令 把 SALES 表 
中 的 所 有 行 复制 到 SALES TMP 表 中 ， 其 中 load sales tmp.msg XW I X fT: 


三 SDECLARE Cl CURSOR BOR SELECT *% PROM FECHNER SALES 
DB20000I The SoL command completed successfully. 


=>LOAD FROM C1 OP CURSOR MESSAGES Load) sales tmp- msg INSERT TINTO 
FECHNER -o SALBS IM? NONRECOVERABLE 


Number of rows read = 41 
Number of rows skipped = 0 
Number of rows loaded = 41 
Number of rows rejected = 0 
Number of rows deleted = 0 
Number of rows committed = 41 
` 三 
7.3.5 ”INGEST 一 一 性 能 和 可 用 性 间 平 衡 的 使 者 


INGEST 实用 程序 又 称 为 连续 数据 插入 或 CDI,， 是 DB2 V10 引入 的 一 个 高 速 的 客户 端 实用 
程序 ， 它 可 以 将 数据 以 流 的 形式 从 文件 和 管道 中 以 较 高 的 速度 插入 到 DB2 目标 表 中 。 同 时 
INGEST 在 移动 大 量 实时 数据 的 时 候 不 需要 像 LOAD 一 样 锁 定 目 标 表 ， 它 使 用 行 锁定 ， 因 此 对 
访问 相同 表 的 其 他 用 户 的 影响 较 少 ， 在 性 能 和 可 用 性 之 间 做 到 了 极 好 的 平衡 。 

INGEST 不 需要 锁定 目标 表 。 它 支持 使 用 下 列 SQL 语句 : INSERT, UPDATE, MERGE, 
REPLACE 和 DELETE 来 对 表 执 行 DML 操作 。 它 还 文 持 使 用 SQL 表达 式 来 根据 多 个 数据 字段 
构建 各 个 列 值 。 

INGEST 文 持 ESE、PureScale 和 DPF 环境 。 它 与 数据 库 引 擎 使 用 相同 的 标准 化 外 部 接口 ， 
是 个 多 线程 工具 ， 速 度 快 ， 效 率 高 。 


INGEST 还 可 以 按 执行 的 时 间 间 隔 或 者 写 入 的 行 数 来 确定 落实 事务 的 频率 。 可 以 使 用 
commit count 参数 来 设置 每 写 入 多 少 行 数据 洲 实 一 次 事务 ， 或 者 使 用 commit period 参数 来 设 
置 插 入 过 程 中 网 次 事务 落实 的 时 间 间 隅 。 缺 省 情况 下 commit period 值 为 1， 即 INGEST 每 1 
秒 钟 落 实 一 次 事务 。 如 果 同 时 设置 了 commit count 和 commit period,， 那 么 这 两 个 参数 同时 起 
作用 ， 即 如 果 它 已 写 入 指定 行 数 或 指定 秒 数 内 没有 落实 操作 ， 那 么 它 会 发 出 落实 指令 。 通 过 
INGEST SET 命令 ， 可 以 来 调整 commit count 参数 为 每 插入 1000 行 落实 一 次 事务 : 


=>ingest set commit count 1000 


DB20000I The INGEST SET command completed successfully 


INGEST 可 以 将 已 拒绝 的 记录 复制 到 文件 (通过 DUMPFILE 参数 指定 ) 或 表 中 (通过 
EXCEPTION TABLE 参数 指定 ) ， 也 可 以 直接 废弃 这 些 记录 。 

当 INGEST 意外 中 断 时 ， 还 可 以 重新 启动 和 恢复 。 缺 省 情况 下 ， 将 从 最 后 一 个 落实 点 重新 
启动 所 有 INGEST 命令 。 另 外 ， 如 果 设 置 了 retry count 参数 ， 那 么 INGEST 实用 程序 也 会 尝试 
从 某 些 错 误 中 恢复 。 

INGEST 命令 文 持 的 输入 数据 格式 和 插入 的 目标 对 象 如 表 7-3 Pros: 
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表 7-3 INGEST 支持 的 文件 格式 和 目标 对 象 类 型 
输入 格式 目标 对 象 

定 界 文本 ; 常规 表 ; 

位 置 文本 和 二 进 制 文件 ; 昵称; 

各 种 顺序 和 格式 的 列 多 维 集群 MDO) ; 
分 区 表 ; 
由 用 户 维 护 的 物化 查询 表 (MQT) ; 
临时 表 ，; 
可 更 新 的 视图 


单个 INGEST 命令 将 经 历 三 个 主要 阶段 : 
1. 传输 
传输 程序 从 数据 源 中 读 取 记录 ， 并 将 记录 放置 在 格式 化 程序 队列 中 。 对 于 INSERT 和 


MERGE 操作 ， 每 个 输入 源 都 有 一 个 传输 程序 线程 〈 例 如 ， 每 个 输入 文件 有 一 个 线程 ) 。 对 于 
UPDATE 和 DELETE 操作 ， 只 有 一 个 传输 程序 线程 。 


2. 格式 化 

格式 化 程序 会 解析 每 个 记录 , 将 数据 转换 成 DB2 数据 库 系 统 所 需要 的 格式 , 并 将 每 个 已 格 
式 化 的 记录 放置 在 该 记录 的 分 区 上 的 其 中 一 个 清空 程序 队列 中 。 格 式 化 程序 线程 数 由 
num formatters 配置 参数 指定 。 访 参数 的 缺 省 值 为 馆 辑 CPU 数 /2。 


比较 : 物理 CPU 个 数 、CPU 内 核 数 和 逻辑 CPU 个 数 


o 物理 CPU 个 数 : 实际 服务 器 中 播 构 上 的 CPU ^. 

e CPU 内 核 数 : 物理 CPU 个 数 与 每 颗 物理 CPU 的 内 核 数 的 乘积 。 

o XH CPU 个 数 : 没有 开启 超 线 程 的 情况 下 ， 逻 辑 CPU 数目 等 于 CPU 内 核 数 ; 如 果 
开 居 超 线程 的 话 ， 有 还 辑 CPU 个 数 是 CPU 内 核 数 的 两 倍 。 


Hi 


NEZ 
3. /月 


清空 程序 发 出 SQL 语句 以 对 DB2 表 执 行 操作 。 每 个 分 区 的 清空 程序 数 由 num flushers_ 
per partition 配置 参数 指定 ， 访 参数 的 缺 省 值 为 1 与 (逻辑 CPU 数 /2/ 分 区 数 ) 之 中 的 较 大 者 。 

在 使 用 Ingest 工具 之 前 ， 需 要 首先 创建 restart 信息 表 ， 有 了 这 张 表 ，ingest 工具 就 可 以 将 
相关 的 进度 信息 存放 在 这 张 表 中 ， 以 便 下 次 restart 的 时 候 使 用 。 可 以 使 用 系统 存储 过 程 
sysinstallobjects 来 创建 restart 信息 表 ， 其 第 一 个 参数 为 工具 名 称 ， 在 这 里 为 “INGEST”， 第 二 
个 参数 为 操作 的 行为 ，“C ”表示 创建 ， 第 三 、 四 两 个 参数 分 别 表 示 对 象 所 在 的 表 空 间 和 模式 ， 
当 使 用 null 时 表示 使 用 默认 值 。 执 行 完 成 后 ， 可 以 使 用 describe 命令 来 但 看 创建 好 的 restart 信 
息 表 INGESTRESTART， 由 于 这 张 表 是 INGEST 命令 内 部 使 用 ， 在 此 就 不 做 过 多 解释 。 
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=> Call sysproc.sysinstcallobjects ("INGEST "CY null null) 


Return Status = 0 
=> describe table "SYSTOOLS.INGESTRESTART 


Data type Data type Column 


Column name Schema name Length Scale Nulls 
JOBID SoS NM VARCHAR 2.90 0 No 
APPLICATIONID SIMI] VARCHAR 256 0 No 
PLUSHERID 55M INTEGER 4 0 No 
PLUSHERDISTID xot II INTEGER 4 0 No 
TRANSPORTERID SAEM INTEGER 4 0 No 
BURE ERI D bo SIS BIGLILNT 8 0 No 
BENS So Sd el BIGINT 8 0 No 
ROWSPROCESSED SMSEM INTEGER 4 0 No 


8 record(s) selected. 


下 面 通 过 几 个 简单 的 例子 讲解 一 下 Ingest 的 用 法 。 我 们 使 用 Sample 数据 库 中 的 staff 表 作 
HERAT, Hu staff 表 导 出 : 


=>export to staff.del of del select * from staff 
SOLSLOQAN ne 
SOL3105N The Exporte utility E SEIT Scopo om POWS. 


Number of rows exported: 35 


最 简单 的 业务 场景 是 对 数据 不 加 任何 处 理 ， 和 直接 导入 到 和 原 表 结 构 相 同 的 表 中 : 


=>create table staff02 like staff 

DB200001 The SQL command completed successfully. 

—»INGEST FROM FILE staff.del FORMAT DELIMITED INSERT INTO staff02 

Ep OE The ingest utility is starting art "12/10/2012 23:58:52.783010". 
SOL29I4I The ingest utility nhas started) the following ingest Jobs 
“DB21001:20121210.235852.783010:00003: 00009", 


Number of rows read = 35 
Number of rows inserted = 35 
Number of rows rejected = 0 


SOL2980I The ingest utility completed successfully at timestamo "12/10/2012 
23:58:55., 6692898% 


INGEST 支持 在 导入 数据 的 同时 ， 通 过 相应 的 运算 ， 将 运算 结果 导入 到 新 增加 的 列 中 。 下 
面 这 个 例子 先 计 算 SARLARY 和 COMM 的 和 ， 随 后 将 结果 插入 到 痢 增 加 的 INCOME 列 中 : 


=> create table staff03 like staff 

DB20000I The SQL command completed successfully. 

-7alter table statfÜ0S add column »ncome decsmal(9,2) 

DB200001 The SQL command completed successfully. 

-»INGEST FROM FILE staff.del FORMAT DELIMITED ($ID SMALLINT EXTERNAL,S$NAME 
CHAR(9),S$DEPT SMALLINT EXTERNAL, $JOB CHAR(5),S$YEARS SMALLINT EXTERNAL, SSALARY DECIMAL (7,2) 
EXTERNAL, SCOMM DECIMAL(7,2) EXTERNAL) INSERT INTO 
staff03 (ID, NAME, DEPT, JOB, YEARS, SALARY, COMM, INCOME) values ($ID, $NAME, SDEPT,SJOB, SYEARS, 


2/2 


第 7 章 配置 参数 与 运 维 工具 优化 


SSALARY,SCOMM,NVL(S$SALARY,O)-«NVL(S$COMM,0)) 
SOL2979I The ingest utility is starting at "12/12/2012 23:08:04,.555699", 
SQL29141I The ingest utility has started the following ingest job: 
“DB21001:;20121212.230804.555699:00003: 00010". 


Number of rows read = 35 
Number of rows inserted = 35 
Number of rows rejected = 0 


SOL2980I The ingest utility completed successfully at timestamo "12/12/2012 
23:08:07. 084783" 


INGEST 还 文 持 在 导入 数据 时 更 新 匹配 的 行 。 下 面 的 例子 中 ， 在 导入 数据 时 ， 如 有 果 存 在 和 
ID 匹配 的 行 ， 融 用 导入 数据 行 中 的 SALARY 值 更 新 该 ID 对 应 的 SALARY 值 ， 如 条 不 存在 匹 
配 的 行 ， 则 忽略 该 行 : 


=> INGEST FROM FILE staff.del FORMAT DELIMITED ($ID SMALLINT EXTERNAL, $NAME 
CHAR (9), SDEPT SMALLINT EXTERNAL, $JOB CHAR(5),S$YEARS SMALLINT EXTERNAL, SSALARY DECIMAL (7,2) 
EXTERNAL, $SCOMM DECIMAL (7,2) EXTERNAL) UPDATE STAFF03 set (SALARY)=($SALARY) WHERE ID-$ID 
EIE 905W Configuration parameter “NUM PLUSHERS PER PARTITION" has been 
automatically adjusted to the following value: "1". Reason code- "]2" 
SOL2979I The ingest utility is starting at "12/12/2012 23310:53.,589666", 
SOhZ29T14T The ingest utility nhas sbarbed the following ingest Jobs 
“"DB21001:20121212.231053.589666:00003: 00010", 


Number of rows read = 35 
Number of rows updated = 35 
Number of rows rejected = 0 


SOL2902I The ingest utility Completed art timestamp "12/12/2012 
25210:;54.691005". Number of errors; “O. Number of warnings: WIW., 


还 可 以 在 导入 数据 时 删除 匹配 的 行 。 下 面 在 插入 数据 时 ， 如 朱 不 存在 D MEKI, LE 
WEVATT. USUS ern 5 ID 匹配 的 行 : 


=> INGEST FROM FILE staff.del FORMAT DELIMITED ($ID SMALLINT EXTERNAL, $NAME 
CHAR (9), SDEPT SMALLINT EXTERNAL, $JOB CHAR (5), $YEARS SMALLINT EXTERNAL, $5SALARY DECIMAL (7,2) 
EXTERNAL, $SCOMM DECIMAL (7,2) EXTERNAL)DELETE FROM STAFF03 WHERE ID-$ID 
SOL2905W Configuration parameter "NUM PLUSHERS PER PARTITION” has been 
automatically adjusted to the following value: "1". Reason code= "12" 
SOL2979I The ingest utility is starting art "12/12/2012 23:12331,517123", 
SỌL2914I The ingest utility has started the following ingest job: 
"DB21001:20121212.231231 .51712300003:00010. 


Number of rows read = 35 
Number of rows deleted = 35 
Number of rows rejected = 0 


S0L2902I1 The ingest utility comoleted art timestamo "12/12/2012 
23812832.475787",. Number of errors; “0. Number of warnings: YI., 
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7.3.6 ”使 用 db2move 在 数据 库 间 移动 数据 


db2move 是 一 个 在 数据 库 之 间 批 量 移 动 大 量 数 据 的 工具 。 它 文 持 的 选项 包括 EXPORT、 
IMORT、LOAD 和 COPY。 其 中 EXPORT、IMORT 和 LOAD 在 与 db2move 结合 的 时 候 ， 可 以 同 
时 对 多 个 表 《〈 比 如 一 个 模式 下 面 的 所 有 表 ) 进行 导入 导出 。COPY 选项 用 来 把 一 个 或 多 个 模式 中 
的 所 有 表 和 数据 复制 到 另 一 个 数据 库 中 。 上 听 起 来 很 有 趣 ， 我 们 来 看 一 下 db2move 的 使 用 方法 。 


db2move dbname action options 


这 里 的 action 指 的 是 EXPORT、IMORT、LOAD 和 COPY 其 中 之 一 。 

e EXPORT: 根据 options 中 指定 的 过 滤 条 件 导 出 表 ， 如 果 不 指 定 options， 则 导出 数据 库 
中 所 有 表 。 导 出 的 表 信 息 存 在 一 个 叫做 db2move.lst 的 文件 中 。 

e IMPORT: 导入 db2move.lst 中 列 出 的 表 数 据 ，IMPORT 选项 由 options 中 的 -io 决定 ， 
包括 INSERT、INSERT UPDATE、REPLACE、CREATE 和 REPLACE CREATE， 默 
认 是 REPLACE CREATE. 

e LOAD: A db2move.lst 中 列 出 的 表 数 据 ，LOAD 选项 由 options 中 的 -lo 决定 ， 包 括 
REPLACE 和 INSERT, SRV Æ INSERT. 

e COPY: 需要 借用 SYSTOOLSPACE 表 空 间 ， 把 一 个 或 多 个 模式 中 的 表 数 据 复制 到 另 一 
个 数据 库 中 ， 目 标 数据 库 必 须 是 本 地 数据 库 。 

命令 中 的 options 配合 action 一 起 使 用 ,决定 了 导入 或 导出 的 方式 和 范围 等 信息 ,结合 COPY 

选项 ， 使 用 db2move 把 一 个 模式 下 的 所 有 表 从 一 个 数据 库 复 制 到 男 一 个 数据 库 。 


Lae mma I ce eve somnb oo Smndb2tdee Co PD Pe om le ER Roe 
USING 123456 MODE DDL ONLY 


Application code page not determined, using ANSI codepage 819 


Detected. DBZDBDET eny variable as “VLDE”, cisabling for duration of utilicy.s]l 


大 大大 大 大 DB2MOVE 大 大大 大 大 


ACTIONS (OP 


Start time: Fri Apr 29 23s 42 19 2011 
All schema names matching: DEINDE 


Connecting to database SAMPLE1 ... successful! Server : DB2 Common Server V9.5.3 


Copy schema DB2LDE to DB2LDE on the target database SAMPLE2 


Create DMT ç “SYSTOOES ,YDMT Eod c 


db2move finished successfully 


Files generated: 
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COBPYSCHEMA. 20110429234219 ,mesg 
Please delete these files when they are no longer needed. 


[Re-enabling DB2DBDFT env variable to "LDE" on completion of utility. ] 


执行 了 这 个 例子 的 命令 后 ， 数 据 库 samplel 中 凡是 模式 名 字 为 db2lde 的 表 将 会 被 复制 到 有 目 
标 数 据 库 sample2 中 。 其 中 ，DDL_ ONLY 选项 表示 只 在 目标 数据 库 sample2 建立 表 而 不 导入 数 
据 。 当 然 还 可 以 用 LOAD ONLY 和 DDL AND LOAD, H} LOAD ONLY 表示 只 导入 数据 ， 
DDL AND LOAD 表示 建 表 并 导入 数据 。 

如 条 需要 改变 表 所 在 的 表 衬 间 , 可 以 加 入 如 下 代码 所 示 的 TABLESPACE_MAP 选项 ,这样 
原来 在 TSI 表 衬 间 的 表 在 复制 时 被 放 到 TS2 表 空 间 ， 原 来 在 TS2 表 空 间 的 表 补 放 到 TS3 KE 
间 ，SYS_ANY 表示 其 他 表 空 间 由 数据 库 选 择 映 射 关系 。 


TABTE EACE A a a a A) 


除了 原封 不 动 的 搬运 ， 还 可 以 在 导入 过 程 中 进行 模式 映射 。 通 过 在 db2move 命令 中 使 用 
SCHEMA MAP 选项 在 下 例 中 将 模式 source schemal 映射 为 target schemal, source Schema2 
BL HT target schema2: 


SCHEMA MAP ((source schemal, target scehnemal), (source schemaz, target Sense) ) 


表面 讲述 了 db2move 的 基本 用 法 , 但 是 在 实战 中 ,还 需要 设置 正确 的 系统 参数 和 数据 库 参 
数 ， 下 面 瓯 是 由 于 系统 参数 没有 正确 设置 导致 命令 执行 失败 的 一 个 守 例 。 

客户 使 用 DB2 V9.7.6， 运 行 在 HP-UX 平台 ， 使 用 db2move mydb load -lo replace 命令 进行 
数据 库 迁 移 。 试 验 了 很 多 次 ， 当 迁移 了 10% 左 右 的 表 时 就 会 出 错 ， 检 查 db2diag.log， 发 现下 面 
I EA: 


2012-11=27-=22.03.539.0408631+480 E4604733A800 LEVELS Beror (0S) 
PID 2 11563 SED EE UT. PROCEED Sc 
IENISSIUPODIS SEC pet NODE : 000 DB 8 NCXH 

APPHDL 3 0=68 APPIDI “LOCAL. Co2instl 121127135620 
AUTHID 3 DB2INSTI 

EDUID enu EDUNAME: db2agent (NCXH) O 


FUNCTION: DB2 UDB, oper system services, sqlowqueInternal, probe:40 
MESSAGE : ZRC-0x870F0041--2029060031-2SQLO QUE NOT SENT "Message Not Sent" 


DIA8557C No message was sent using the message queue. 


CALLED 3 OS, =; megsnel 

OSERR : EAGAIN (11) "Resource temporarily unavailable" 

人 wo 
0x06C0004B 

DATA 42 : Pointer, 8 bytes 

OxOfffffffebfea670 


DATA 43 : unsigned integer, 8 bytes 


通过 分 析 铬 误 日 和 六， 可 以 看 出 是 由 于 系统 消息 队列 参数 值 过 小 ， 使 用 db2osconf 对 HP-UX 
内 核 参 数 进 行 推荐 ， 但 是 给 出 有 关 消 息 队 列 的 推荐 值 明 显 人 往 小 ，msgmnb、msgtql 和 msgmni 明 
显 偶 小 ， 无 法 满足 需要 。 
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*CkCk Kk X KCk ck Kk KCk Ck ck k kock kk X System Resources ACC KCk KO X kk Kk XC Ck k ok k k k kk kkk* 


Physical RAM ==> 137259171840 
Number of CPUS ==> 16 
System Scale Factor ==> 8192.00 


* Recommended HP-UX Kernel Parameters Based on this System * 


nproc --» 8208 

maxuprc ==> 2736 

maxs hrean proe e 09 
maxfiles ==> 4096 
maxtiles lim ==> 65535 
nflocks ==> 16384 

ninode ==> 11469 

msgmnb ==> 65535 

msgtql ==> 6554 

msgmni ==> 6554 


semmns ==> 16385 
semmni ==> 8192 
semmnu ==> 8192 
shmmax ==> 123533254656 
shmmni ==> 8192 


maxdsiz 64bit => 1900000000 


通过 手工 增 大 消息 队列 参数 ， 将 这 三 个 参数 值 设 置 为 : 


msgmnb (max # of bytes on a message queue, i.e max-msg-qbytes in Solaris 10+) = 2097152 

msgmni (max 4 of message queues, i.e max-msg-ids in Solaris 10+) = 327607 

msgtql (max # of message on all message queues, i.e max-msg-messages in Solaris 10+) 
— 262144 


重新 运行 db2move mydb load -lo replace， 成 功 加 载 数据 。 
7.3.7 db2relocatedb 一 一 DB2 移 形 换 位 


DB2 数据 库 有 大 量 的 内 部 元 数据 ， 这 些 数 据 接 述 了 用 户 数 据 存 放 人 位置、 用户 数据 属于 谁 、 
以 及 如 何 引 用 它们 。 元 数据 总 是 被 DB2 EIE "4xn. HOM DBA 都 不 会 直接 接触 它 。 

例如 ，DBA 需要 修改 数据 库 的 名 称 ， 通常 可 以 使 用 DB2 的 备份 和 恢复 命令 来 完成 。 先 备 
份 数据 库 ， 然 后 用 狐 的 名 字 恢 复 。 备 份 操作 可 以 在 线 完 成 ， 但 恢复 操作 是 离线 的 ， 而 且 其 间 数 
据 库 不 能 使 用 ， 如 条 有 高 可 用 性 要 求 ， 那 么 这 种 情况 是 不 可 接受 的 。 

另外 一 个 例子 是 改变 表 衬 间 容 喜 的 位 置 ， 通 第 的 做 法 是 通过 备份 和 重 定 癌 恢 复 守 成。 如果 
KTHE DMS， 那 么 还 有 一 种 选择 ， 那 就 是 首先 使 用 ALTER TABLESPACE 语句 癌 独 的 位 置 
添加 容 匿 ， 然 后 再 从 原来 位 置 删除 容 句 。 这 种 方法 的 副作用 是 操作 必须 按 顺 序 进 行 ， 操 作 之 后 
会 出 现 表 空间 重 平衡 。 

上 上 面 的 例子 中 ， 其 实 都 是 要 求 修 改 DB2 的 元 数据 , 但是， 备份 和 恢复 要 做 到 这 一 点 代价 太 
大 ， 难 以 满足 实际 需要 。 本 节 中 将 要 讲 到 的 db2relocatedb 工具 在 这 些 场景 中 却 大 有 用 武之 地 。 

db2relocatedb 并 不 修改 数据 库 的 实际 物理 位 置 ， 而 是 通过 修改 DB2 元 数据 的 方式 来 重新 
指定 数据 库 的 物理 位 置 ， 比 如 容器 位 置 和 日 六 目录 位 置 ， 也 可 以 用 来 更 改 数 据 库 的 名 称 。 
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使 用 db2relocatedb 之 前 ， 需 要 停止 db2 实例 ， 其 命令 格式 很 简单 ， 上 只 需要 运行 : 


db2relocatedb -f relocate.cfg 


天 键 的 内 容 在 relocate.cfg 配置 文件 里 ,可 以 在 该 文件 中 定义 需要 变更 的 内 容 ， 包 括 数 据 库 
的 名 字 (DB NAME) 、 数 据 库 的 路 径 (DB PATH) 、 实 例 (INSTANCE)、 分 区 节点 的 编号 
(NODENUMD 、 在 线 日 志 路 径 (LOG DIR) 、 容 器 的 位 置 (CONT PATH) 、 目 动 存 储 管理 
的 存储 路 径 (STORAGE PATH) 、 归 档 失 败 路 径 CFAILARCHIVE PATH) 、 上 归档 方法 
(LOGARCHMETHI, LOGARCHMETHO) 、 镜 像 在 线 日 志 路 径 CMIRRORLOG PATH) 、 前 
滚 恢 ae ede 位 置 COVERFLOWLOG PATH) 。 

接 下 来 ， 一 个 实战 案例 来 说 明 db2relocatedb 的 用 法 。 

ee Linux 服务 器 后 ，db2 实例 可 以 启动 ， 但 是 无 法 成 功 连接 ， 通 过 检查 
db2diag.log， 发 现 了 下 和 面 的 错误 : 


2012=11=06=13.43.03.157979+480 149705715E481 LEVEL; 区 OTE 

EX 3 910 TID 3 47931096820032PROC ENDE cc 
INSTANCE; Clo2insti NODE : 000 DB 3 XXDB 

APPHDL 3 0=19 APPIDs 10.137.249. 101.29398.-121106054304 
AUTHID 23 DB2INSTI 

BDULD es EDUNAME: db2agent (YXDB) O 


FUNCTION; DB2 UDB, base sys utilities, sgle GCertRelDBLOCkForIinstance, Probes: 25 
MESSAGE : /arch/db2log/db2inst1/NODE0000/SQL00001/SQLINSLK 


2012=11=-06=15,.45.03.157979+480 I149706197E572 LEVEL: Severe 

EARD 3 910 TID 3 47931096820032PROC  G@52Sy7SG (0 
INSTANCE; co2insti NODE : 000 DB EDOD 

APPHDL 3 0=19 APPIDs 10,.157.249.,101,.2958.-121106054304 
AUTHID 23 DB2INSTI 

EDUID D EDUNAME: db2agent (YXDB) O 


FUNCTION: DB2 UDB, base sys utilities, sqeLocalDatabase::FirstConnect, probe:5 
RETCODE : ZRC=0x870F0016=-2029060074=SQLO SHAR "File sharing violation." 


ww 
. 


DIA8519C A file sharing violation has occurred, filename was 


这 种 错误 通常 是 由 于 db2 相关 进程 , 例如 db2cos 没有 释放 加 在 控制 文件 上 的 锁 导 致 的 。 常 
规 的 解决 办 法 是 使 用 db2 kill 杀 挥 其 他 进程 ， 以 及 用 ipclean 清理 IPC 资源 。 但 是 现场 经 过 各 种 
笠 试 ， 甚 至 也 试 了 芷 启 机 器 ， 这 个 问题 都 无 法 解决 。 

后 来 经 过 检查 ， 发 现 客户 所 使 用 数据 库 mydb 的 DB PATH Carch/db2log) ERTE NFS X 
FARRE, MAZAH db2relocatedb 命令 将 DB PATH 从 /arch/db2log 移动 到 盘 阵 
/datal/dbpath， 最 终 解 决 了 这 个 问题 

整个 处 理 步 又 如 下 : 
(1) 检查 原来 的 建 库 语 句 ， 发 现 DB PATH 创建 在 NFS 文件 系统 /arch/db2log 上 : 


create database mydb automatic storage yes on /datal, /data2, /data3 dbpath on 
/arcch/db2log using codeset UTF=6 territory CN pagesize 32 


(2) 复制 /arch/db2log 下 所 有 文件 到 新 的 路 径 /datal/dbpath : 


cp -ri /archn/db2log/* /datal/dbpath 
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(3) 编辑 移动 文件 rel.cfg， 内 容 如 下 : 


DB NAME=mydb 
DB PATH-/arch/db210g,/datal/dbpath 
INSTANCE-db2instl1 


(4) 使 用 db2relocatedb 命令 修改 DB PATH: 


db2relocatedb -f rel.cfg 

Files and control structures were changed successfully. 
Database was catalogued successfully. 

DBT1000I The tool completed successfully. 


(5) IADE e: 


db2 connect to mydb 


Database Conneccion mn 


Database server = DB2/ LINUX 9.7.6 
SOL a&utcnorizacion ID = DB2INSTI 
Local database alias = mydb 


FN 注意 :db2relocatedb 的 使 用 D | 
db2relocatedb 是 一 种 离线 工具 ， 绝 不 能 在 数据 库 开 启 时 运行 它 ，。 


下面 是 使 用 db2relocatedb 工具 的 最 佳 实践 : 
(12 db2relocatedb 对 数据 库 文 件 和 控制 结构 的 修改 不 记 入 日 志 ， 这 些 修 改 是 不 可 修复 的 。 
因此 ， 强 烈 建议 在 对 数据 库 使 用 该 工具 之 后 ， 进 行 完 整 的 备份 。 
(2) 如 果 要 进行 重要 的 修改 或 者 进行 用 户 认 为 可 能 难以 逆转 的 修改 ， 最 好 考虑 在 修改 之 
前 进行 备份 。 
(3) 虽然 db2relocatedb 工具 可 以 改变 表 空 间 容 妖 的 位 置 ， 但 不 能 用 它 来 改变 容 絮 的 数量 
和 大 小 ， 唯 一 办 法 是 使 用 重 定 问 恢 复 。 
(4) 将 所 有 数据 库 从 一 个 路 径 移 动 到 另 一 个 路 径 是 完全 有 可 能 的 ， 只 需 为 每 个 数据 库 创 
建 配 置 文件 并 运行 db2relocatedb 即 可 。 
如 果 移 动 了 数据 库 ， 但 是 态 记 移动 容器 ， 或 者 态 记 在 配置 文件 中 添加 上 相应 的 条 目 ， 仍 然 
可 以 连接 到 数据 库 。 这 时 可 以 使 用 LIST TABLESPACES SHOW DETAIL 查看 所 有 表 空 间 的 状 
态 ， 确 保 没 有 一 个 表 空 间 处 于 OFFLINE 状态 。 如 果 处 于 OFFLINE 状态 ， 应 该 关闭 数据 库 ， 
改正 出 现 的 问题 ， 然 后 再 重新 运行 该 工具 〈 该 工具 拥有 足够 的 智能 了 解 自己 已 经 完成 了 该 工作 
的 一 部 分 ， 因 此 第 二 次 运行 不 会 造成 任何 损害 ) 。 
7.3.8 ”存储 过 程 一 -内 部 数据 挪移 的 利器 
从 DB2 V9.7 开始 ， 提 供 了 两 个 系统 存储 过 程 ADMIN MOVE TABLE 和 ADMIN COPY 
SCHEMA, 它们 都 位 于 SYSPROC 模式 下 面 。 前 者 可 以 将 表 从 一 个 表 空 间 移 动 到 另 一 个 表 空 间 ， 


包括 表 数 据 ， 所 有 的 表 选 项 、 索 引 和 视图 也 痢 会 被 移动 。 在 移动 过 程 中 ， 表 处 于 在 线 可 访问 状 
态 〔 只 在 一 个 短暂 阶段 处 于 只 读 状 态 )。 它 也 可 以 实现 离线 表 移 动 ， 而 且 速 度 明 显 快 于 在 线 表 
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移动 。 后 者 有 点 像 在 db2move 中 使 用 的 COPY 选项 ， 可 以 用 来 复制 某 个 SCHEMA 中 的 全 部 对 
象 以 及 数据 ， 但 是 它 只 支持 同一 数据 库 内 复制 。 


1. 使 用 ADMIN MOVE TABLE 在 数据 库 内 移动 表 


如 图 7-6 所 示 ， 展 示 了 在 线 表 移动 过 程 中 各 个 表 的 作用 和 关系 。 


Online table move control table 
SYSTOOLS.ADMIN MOVE TABLE 


tabschema tabname value 


i Ed 
SOURCE TARGET 
TABLE COPY TABLE 


STAGING 


图 7-6 在 线 表 移动 过 程 示 意图 


从 图 7-6 中 可 以 看 到 ， 主 要 涉及 4 个 重要 的 表 : 

e JEK (Source table) : 需要 被 移动 的 表 。 

e 目标 表 〈Target table) : 在 目标 位 置 建立 的 表 ， 表 定义 与 源 表 一 样 ， 用 来 接收 源 表 的 数 

据 ， 在 所 有 数据 移动 完成 后 ， 目 标 表 会 被 重 命名 为 源 表 的 表 名 。 

e MEK (Staging table) : 用 来 记录 移动 过 程 中 其 他 事务 对 表 的 修改 ， 移 动 完 成 后 这 些 

修改 会 在 目标 表 重 放 ， 结 束 后 阶段 表 会 被 删除 。 

e 移动 控制 表 (SYSTOOLS.ADMIN MOVE TABLE) : 记录 了 表 移 动 时 的 进度 和 状态 信 

息 ， 这 个 表 存 放 于 SYSTOOLSPACE 表 空 间 中 。 

在 线 表 移 动 的 方法 主要 分 为 两 种 : 一 种 方法 基本 上 属于 全 上 自动， 只 允许 改变 部 分 目标 表 的 
定义 ， 不 需要 在 移动 前 手动 建立 目标 表 。 第 二 种 方法 提供 了 更 灵活 的 控制 和 选择 ， 但 需要 事先 
建立 好 目标 表 。 通 常 第 一 种 方法 是 比较 常用 的 方法 ， 你 只 需要 指定 目标 数据 表 空 间 、 目 标 索 引 
KTA HER LOB 表 空 间 ， 其 他 参数 可 以 置 空 。 

通过 下 面 的 实例 来 学 习 如 何 把 一 个 表 从 一 个 表 空 间 移动 到 男 一 个 表 空 间 。 


= 
syscat.tables where tabname-'STAFF'" 
TABLE TABLESPACE 
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STAFF 


1 record (s) 


=> db2 "CALL SYSPROC.ADMIN MOVE TABLE('DB2LRI', 


Y 


TS1 


''','MOVE')" 
Result set 1 


selected. 


' STAFF', 


TS DEC OUO MM 


Y 


Y 


, 


AUTHID 

CLEANUP END 
CLEANUP START 
COPY END 

COPY OPTS 

COPY START 

COPY TOTAL ROWS 


DB2LR1 
2011=04=30=07.01.46.35364862 
2011=04=30=07.01.46.5443574 
2011=04=30=07.01.45.823364 
ARRAY INSERT, NON CLUSTER 
2011=04=30=07.01.45,.729002 
25 


INDEXNAME 
INDEXSCHEMA 
INIT END 
INIT START 
REPLAY END 
REPLAY START 


2011=04=50=07.01.45.714766 
2011=04=30=07.01.45.195087 
ZU pud Dc 01.46,.454644 
2011=04=30=07.01.45.823836 


REPLAY TOTAL ROWS 0 

REPLAY TOTAL TIME 0 

STATUS COMPLETE 

SWAP END 2011-04-30-07.01.46.518082 
SWAP RETRIES 0 

SWAP START 2011-04-30-07.01.46.489645 


VERSION 09.07.0004 


20 record (e) selected. 


Return Status = 0 


= 


Syscat.tables where tabname-'STAFF'" 


TABLE TABLESPACE 


STAFF TS2 


1 record (s) selected. 


从 例子 中 可 以 看 到 表 STAFF 被 成 功 地 从 表 空 间 TS1 移动 到 表 空 间 TS2， 其 索引 以 及 LOB 
数据 也 都 和 "移动 到 表 和 空间 TS2 中 ,在 例子 中 我 们 用 了 MOVE 选项 , 执行 INIT. COPY, REPLAY 
和 SWAP 步骤 ， 这 是 一 种 一 气 呵 成 的 办 法 。 

除了 MOVE 以 外 ， 还 可 以 分 步 实 现 数据 移 动 ， 这 些 步骤 包括 INIT, COPY, REPLAY., 
VERIFY, SWAP, CLEANUP 和 CANCEL. 

e INIT: 初始 化 目标 表 、staging KAMMLER o 

e COPY: 从 源 表 问 目标 表 复 制 数 据 ， 复 制 过 程 中 ， 对 源 表 的 操作 将 记录 在 staging KF. 
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e REPLAY: 将 staging 表 中 记录 的 操作 在 目标 表 上 重 放 。 

e VERIFY: 可 选 ， 检 查 源 表 和 目标 表 中 的 内 容 是 否 完全 一 致 。 

e SWAP: 源 表 下 线 ， 目 标 表 上 线 。 

e CLEANUP: 清理 现场 ， 例 如 删除 staging xe; 删除 建立 在 源 表 上 的 非 唯 一 性 索引 和 触 

Ads; WR KEEP 选项 没有 指定 的 话 ， 删 除 源 表 。 

e CANCEL: 取消 数据 移动 。 

下 面 是 使 用 ADMIN MOVE TABLE 的 先决 条 件 和 限制 。 

首先 需要 注意 的 是 ，ADMIN MOVE TABLE 不 支持 具有 外 键 约束 的 表 ， 并 且 在 执行 前 需 
要 确保 数据 库 里 有 SYSTOOLSPACE 表 空 间 。 

其 次 在 移动 过 程 中 对 源 表 进行 的 某 些 操作 会 使 源 表 和 目标 表 数 据 不 一 致 ， 这 些 操作 包括 : 

e TRUNCATE TABLE 《没有 使 用 restrict when delete triggers 选项 ) 。 

e IMPORT:-REPLACE INTO: (用 替换 方式 进行 导入 ) 。 

e LOAD TABLE. 

e ALTER TABLE. 

e REORG. 

为 了 限制 这 些 操作 ，DB2 使 用 了 一 个 表 级 的 状态 标记 ， 这 个 标记 在 INIT 阶段 设置 ， 在 
CLEANUP 或 者 CANCEL 时 解除 。 在 数据 移动 期 间 ， 如 果 试 图 执行 上 述 这 些 被 限制 的 操作 ， 那 
么 这 些 操作 会 返回 SQL0668N (原因 代码 为 10) 的 错误 信息 。 

通过 查询 移动 控制 表 (SYSTOOLS.ADMIN MOVE TABLE) 可 以 查看 当前 表 移动 的 状态 。 
例如 下 面 的 查询 可 以 返回 正在 移动 数据 的 表 状 态 : 


[db2insti8db2 «]$9db2 "SELECT varchar(tabschema,10) as schema, varchar(tabname,10) as 
table, yarchar (value, 10) as status FROM SYSTOOLS. ADMIN MOYE TABLE WiiaRE key = "STATUS “ 
AND VARCHAR (value, 10) <> 'COMPLETE' WITH UR" 


SCHEMA TABLE STATUS 
DB2LR1 SALES COPY 
DB2LR1 PRODUCT INIT 


2 record ls) selected. 


从 上 例 中 可 以 看 到 有 两 个 表 正 在 做 表 移 动 ， 表 SALES 正 处 于 COPY 状态 ， 而 PRODUCT 
正 处 于 INIT 状态 。 
当 用 户 有 以 下 需求 时 ， 可 以 考虑 使 用 ADMIN_MOVE_TABLE: 

(1) 在 DB2 V9.7 对 存储 结构 进行 了 调整 , 通过 ALTER TABLESPACE 语句 与 REDUCE 
选项 配合 使 用 ， 可 随时 回收 末 使 用 的 存储 空间 ， 这 人 简化 了 表 空 间 的 人 雄 厂 省 理 。 但 是 从 以 前 版 本 
升级 上 来 的 数据 库 的 表 空 间 还 是 使 用 过 去 的 存储 结构 ， 这 时 我 们 可 能 需要 使 用 在 线 表 移 动 把 已 
经 存在 的 表 移动 到 狐 建 的 可 回收 表 空 间 ， 从 而 利用 可 回收 表 空 间 的 好 人 处。 

(2) 为 了 突破 源 表 空间 大 小 限制 ， 可 以 把 表 从 一 个 表 空 间 移 动 到 一 个 容量 更 大 的 表 空 间 。 
比如 把 一 个 表 从 一 个 页 大 小 为 16KB 的 表 衬 间 移 动 到 32KB VK A T A 

(3) 把 一 个 大 表 移 动 到 另 一 个 表 衬 间 ， 为 目标 表 衬 间 建 立 独立 的 绥 剖 池 ， 从 而 提高 性 能 。 
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(4) 把 表 移动 到 不 同类 型 的 表 空 间 中 ， 比 如 将 表 从 SMS 省 理 表 空 间 移动 到 DMS 管理 表 


LM 


2E [RIS 

C55 移动 表 从 而 降低 高 水 位 标记 。 

(6) 把 只 读 或 者 不 经 党 更 新 的 表 移 动 到 单独 的 表 空 间 ， 从 而 提高 增 量 备份 的 性 能 。 

(7) 把 LONG/LOB 数据 移动 到 其 他 开局 系统 缓存 的 表 空 间 ， 从 而 提高 LONG/LOB 数据 
的 读 取 性 能 。 

(8) 不 需要 离线 重组 (Reorg) 就 可 以 实现 对 表 的 压缩 。 

(9) 可 以 在 线 改 变 表 的 一 些 属性 。 例 如 局 用 或 者 撤销 MDC; 启用 或 者 撤销 表 分 区 

(table-partition) ; 改变 分 区 键 ;， 改变 列 的 类 型 ， 比 如 从 LONG VARCHAR 变 成 VARCHAR， 

或 者 从 LONG VARCHAR 变 成 CLOB; 增加 或 删除 列 ; 改变 列 的 顺序 等 。 

C100 在 多 分 区 环境 下 实现 在 线 重 新 分 布 数据 。 

(11) DB2 V9.7 中 引入 了 内 般 LOB F1, WRAAE T NE LOB 的 长 度 定义 ， 需 要 对 表 进 
行 离线 重组 ， 使 用 ADMIN MOVE TABLE 则 可 以 实现 在 线 转换 ， 从 而 避免 离线 重组 造成 的 表 
不 可 访问 。 
2. 使 用 ADMIN_COPY SCHEMA 在 数据 库 内 移动 对 象 


使 用 ADMIN COPY SCHEMA， 必 须 具 有 CREATE SCHEMA 权限 和 所 涉及 对 象 的 特权 
《比如 建 表 的 特权 以 及 EXECUTE 特权 ) 。 另 外 , ADMIN COPY SCHEMA fll ADMIN MOVE | 
TABLE 一 样 也 需要 使 用 SYSTOOLSPACE 表 空 间 。 
使 用 ADMIN COPY SCHEMA 的 示例 如 下 : 


[db2instlGdb2-^]$9db2 "CALLSYSPROC.ADMIN COPY SCHEMA('DB2LRI1', 'LRIADM', 'COPY', NULL, 
DE D SEN ESEQE otn "ERRORNAME M 


Value of output parameters 


Parameter Name : ERRORTABSCHEMA 


Parameter Value : - 


Parameter Name : ERRORTABNAME 


Parameter Value : - 


Return Status = 0 


上 面 的 例子 中 , 执行 过 程 中 使 用 了 COPY 参数 ,表示 在 建立 目标 表 以 后 使 用 LOAD 导入 数 
据 ， 行 为 与 NONRECOVERABLE 导入 方式 相同 ， 最 终 ， 模 式 名 为 DB2LR1 里 的 所 有 对 和 象 都 被 
复制 到 了 模式 LRIADM 中 。 

关于 参数 设 定 方面 ， 还 可 以 使 用 DDL 参数 ,复制 过 程 中 只 建 表 , 不 导入 数据 ， 还 有 COPY 
NO 参数 ， 表 示 建 表 并 使 用 COPY NO 方式 导入 数据 。 男 外 ， 导 入 过 程 中 可 以 将 源 表 复 制 到 不 
同 的 目标 表 空 间 ， 上 例 中 使 用 SYS _ANY， 这 表示 数据 库 自己 判断 导入 哪个 表 空 间 。 

导入 过 程 中 的 错误 信息 被 记录 在 ERRORTABNAME 表 中 ， 该 表 是 由 ADMIN COPY 
SCHEMA 在 SYSTOOLSPACE 表 空 间 里 建立 的 。 最 后 ,操作 完成 以 后 最 好 做 一 个 备份 ， 防止 前 
滚 恢复 导致 表 不 可 访问 。 
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7.3.9 ”特殊 对 象 的 移动 万 式 


众所周知 ,细节 决定 成 败 。 在 这 节 中 我 们 就 来 学 习 一 下 如 何 处 理 DB2 数据 移动 过 程 中 的 两 
种 特殊 对 象 。 
1. IDENTITY 字段 


在 一 个 测试 库 中 ， 我们 使 用 db2move 命令 把 所 有 表 移 动 到 另 一 个 数据 库 过 程 中 ， 发 现 大 部 
分 表 数 据 能 恢复 ， 但 有 些 却 无 法 恢复 并 且 提 示 SQL3550W 错误 。 这 是 怎么 回 事 呢 ? 

在 做 数据 移动 的 时 候 一 定 要 记 住 , 在 DB2 的 表 中 有 一 种 特殊 字段 ， 该 字段 的 值 是 由 系统 分 
配 的 ， 这 类 特殊 的 字段 叫 IDENTITY ^ E. 

create Lable MIEL (Cl int, 


c2 int generated always by identity, 
e3 char (10) ) 


在 上 面 的 定义 中 ， 可 以 看 到 表 MYTBL 中 有 一 列 C2， 它 的 值 是 在 插入 时 由 IDENTITY FH 
动 生成 的 ， 而 GENERATED ALWAYS 表明 该 字段 只 能 由 系统 生成 ， 不 能 由 用 户 指 定 。 对 于 整 
型 的 列 ， 默 认 情 况 下 IDENTITY WEMA 1 开始 每 次 加 1， 当然 也 可 以 进一步 定制 IDENTITY 的 
细节 ， 规 定 它 的 初始 值 和 递增 值 等 详细 信息 。 
IDENTITY 的 具体 使 用 并 不 是 本 节 的 重点 ， 在 这 一 节 主 要 关注 如 何在 数据 移动 时 对 这 些 特 
殊 对 象 进行 处 理 。 先 来 看 看 如 何 癌 表 MYTBL 插入 数据 : 


ldb2insti@db2? ~] $db2 insert into mytbl (el, e3) de cM cc 
DB20000I The SQL command completed successfully. 


ladb2insti@db2 ~] $dob2 insert into mytbl (cel, c3) values (2 EON 
DB20000I The SoL command completed successfully. 


[adb2insti@db2 ~] $db2 select =*= from mytbl 


Ci C2 Ge 
at Tool 
2 2col2 


2 record(s) selected. 


在 上 面 的 例子 中 ， 回 表 里 插 入 了 两 行 数据 ， 在 插入 的 时 候 并 没有 指定 C2 列 的 值 ， 在 插入 
之 后 可 以 看 到 表 里 C2 列 的 值 是 目 动 生成 的 ， 从 1 开始 每 次 加 1. 
如 果 在 插入 时 指定 C2 列 的 值 会 是 什么 结果 呢 ? 请 看 如 下 例子 : 


elle pi Sun Nol Pe es exo o insert into mytbl ee 


DB21034E The command was processed as an SQL statement because it was not a 


valid Command Line Processor command. During SQL processing it returned: 
SOLO798N A value cannot be specified for column "C2", which is defined as 


GENERATED ALWAYS. SQLSTATE-428C9 
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在 上 面 的 插入 语句 中 指定 了 C2 列 的 值 ， 在 执行 语句 中 会 提示 因为 C2 是 指定 了 
GENERATED ALWAYS 选项 的 IDENTITY 列 ， 因 此 插入 被 拒绝 了 。 如 果 在 定义 IDENTITY 列 


时 使 用 的 是 GENERATED BY DEFAULT 选项 ， 则 允许 插入 时 指定 C2 列 的 值 。 


既然 插入 受到 IDENTITY 列 限制 ， 对 于 导入 来 说 也 会 受到 同样 的 限制 ， 特 别 是 指定 了 
GENERATED ALWAYS 选项 的 IDENTITY 列 。 接 下 来 分 别 看 看 在 进行 LOAD 导入 时 如 何 处 理 


带 有 GENERATED ALWAYS 选项 的 IDENTITY 列 。 
在 使 用 LOAD 导入 可 以 结合 identityoverride 选项 进行 导入 ， 比 如 ， 


db2 "load from myfile.del of del modified by identityoverride insert into mytbl" 
SQL3551W The table contains at least one GENERATED ALWAYS column that the 


utilicy will owuwerterde- 


SQL3109N The utility is beginning to load data from file "myfile.del". 


SQL3500W The utility is beginning the "LOAD" phase at time "2011-12-13 
l5 PI RARO DOC 


SOLS519W Begin Load) Consistency Point, Input record count = "O", 


SOLS3520W Load Consistency Point was successful, 


SOL3110N The utility has completed processing. "2" rows were read from the 


input file. 

SOLS519W Begin LOac)i Consistency Point, Input record count = "2", 
SORS S 0 Load Consistency Point was successful., 

SOLS515W The utility has svcnesheds the VLOADY phase at time "20071-12213 


jos 3 LEOSAN 


Number of rows read = 2 
Number of rows skipped = 


Number of rows loaded = 


0 
2 
Number of rows rejected = 0 
Number of rows deleted = 0 

2 


Number of rows committed = 


[ab2insti@dob2 el select = from 而 ED 


2 record(s) selected. 
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在 上 和 面 的 例子 中 ，C2 列 的 值 是 在 导入 时 由 导入 文件 指定 的 而 不 是 自动 生成 的 ， 
identityoverride 还 有 一 个 作用 是 拒绝 那些 在 导入 文件 中 没有 提供 IDENTITY 列 值 的 行 。 关 于 上 
面 提 到 的 3 个 文件 修饰 符 的 具体 含义 ， 如 表 7-4 Bn: 


表 7-4 导入 IDENTITY 字段 时 所 采用 的 文件 修饰 符 
文件 修饰 答 "m 
TRE E 忽略 输入 文件 中 任何 标识 列 的 值 ， 并 为 每 一 行 
生成 一 个 新 的 标识 值 


Identitymissing | 是 ”| 是 | 输入 文件 中 不 包含 任何 目标 表 中 标识 列 的 什 


de EE 在 将 数据 导入 到 目标 表 中 时 ,指定 使 用 输入 文 
件 中 标识 列 的 值 


这 样 数据 不 一 致 的 问题 就 迎刃而解 了 。 

另外 ,使 用 LOAD， 由 于 目标 数据 库 的 表 总 是 新 建 的 ， 如 果 想 保证 IDENTITY 字段 值 能 够 
连续 ， 我 们 需要 在 目标 数据 库 中 手动 更 新 目标 表 IDENTITY 字段 的 值 。 例 如 通过 ALTER 
COLUMN 语句 把 C2 列 的 起 始 值 改 成 了 3， 从 而 保证 了 目标 数据 库 与 源 数据 库 的 数值 连续 性 。 


ALTER TABLE mytbl ALTER COLUMN C2 RESTART WITH 3 


i 


i 


2. 序列 (SEQUENCE) 


序列 也 是 DB2 中 一 类 特殊 的 对 象 ， 它 与 IDENTITY 学 段 有 些 类 似 ， 都 可 以 自动 生成 顺序 
值 ， 但 序列 是 全 局 的 ， 并 不 依赖 于 某 个 表 的 罕 段 ， 因 此 可 以 实现 全 局 范围 内 的 顺序 值 生 成 。 正 
为 这 个 值 是 全 局 的 ， 我 们 在 数据 移动 时 对 这 个 特殊 对 象 更 要 十 分 注意 。 
比如 ， 在 一 个 测试 库 中 ， 有 一 个 序列 myseq， 现 在 使 用 db2move 命令 将 其 移动 到 位 于 不 同 
机 器 的 数据 库 中 ， 看 起 来 一 切 正 常 。 但 是 ， 运 行 一 段 时 间 后 ， 才 友 现 序列 的 号 人 码 出 现 了 错误 ， 
这 是 怎么 导致 的 呢 ? 
在 了 解 真 相 前 ， 来 看 一 个 序列 的 定义 : 
CREATE SEQUENCE myseq AS BIGINT 
MINVALUE 1 MAXVALUE 65535 
SERENE 


CACHE 20 
Ne 


上 上 面 定 义 的 序列 myseq 从 1 开始 , 每 次 递增 1, 其 最 小 值 为 1, 最 大 值 为 65535, CACHE 20 
代表 序列 每 次 生成 20 个 值 缓存 在 内 存 里 ，NO CYCLE 表示 当 序列 生成 到 最 大 值 以 后 不 会 循环 
复 用 以 前 的 值 了 ， 从 而 保证 了 唯一 性 。 

从 序列 的 定义 可 以 看 出 ， 序 列 是 一 个 全 局 的 对 象 ， 并 不 针对 东 个 表 ， 它 会 在 内 部 保存 当前 
序列 的 状态 , 一 旦 序列 删除 后 重建 , 原来 的 状态 就 不 复 存 在 了 ,这 也 回答 了 之 前 提 到 的 db2move 
后 序列 号 码 有 错 的 问题 : 在 进行 数据 移动 过 程 中 ， 序 列 只 能 在 新 数据 库 里 重建 ， 这 样 它 的 值 叉 
从 起 始 值 开 始 。 
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因此 ， 在 进行 数据 移动 的 时 候 ， 一 定 不 要 忘记 根据 源 数据 库 的 序列 状态 对 新 数据 库 中 的 序 
列 状 态 进行 更 新 。 比 如 序列 myseq 在 源 数据 库 中 的 下 一 个 生成 值 是 40， 那 可 以 在 目标 数据 库 发 
出 如 下 命令 : 


ALTER SEQUENCE myseq RESTART WITH 40 


执行 了 上 述 语 名 后 ， 当 在 目标 数据 库 中 再 次 使 用 序列 值 的 时 候 融 可 以 看 到 当前 序列 从 40 
Jan p. 


db2 values next value for myseq 


40 


1 record(s) selected. 


7.4. 备份 恢复 工具 优化 


在 信息 日 趋 发 达 的 今天 ， 数 据 显 得 尤其 重要 。 如 何 保障 数据 的 安全 性 呢 ? 如 何 降低 数据 灾 
难事 故 发 生 时 的 损失 呢 ? 数据 库 备 份 与 恢复 作为 数据 安全 最 有 利 的 保障 手段 的 重要 性 就 不 言 而 
喻 了 。 而 随 痢 数据 量 的 急剧 增加 ， 必 须 优 化 备份 与 恢复 的 整个 过 程 ， 制 定 合理 的 备份 与 恢复 策 
略 ， 才 能 在 有 限 的 维护 窗口 完成 备份 与 恢复 ， 从 而 在 保证 数据 安全 的 同时 ， 将 其 对 于 生产 系统 
的 影响 降 到 最 低 。 

7.4.1 备份 的 基本 原理 与 优化 

数据 库 备 份 概念 其 实 挺 简单 的 : 束 是 将 数据 库 中 所 有 数据 存储 为 一 个 数据 副本 ， 供 数据 库 
出 现 问 题 时 恢复 使 用 。 说 白 了 人， 类 似 于 我 们 将 电话 号 人 码 夭 文 件 从 C 盘 复 制 到 D SEXETI 1 02. 

但 是 ， 与 文件 复制 不 同 的 是 ， 我 们 并 不 能 简单 地 在 DB2 上 使 用 copy 命令 ， 而 是 需要 通过 
DB2 提供 的 备份 工具 (Backup Utility) 来 完成 ， 有 具体 的 使 用 方法 如 下 : 


db2 backup db SAMPLE to /db2/db21de 


如 图 7-7 所 示 ， 备 份 工 具 (Backup Utility) 会 读 取 数 据 库 配置 信息 ， 所 有 的 表 空 间 结 构 和 
数据 以 及 数据 库 历史 记录 文件 , 并 将 它们 保存 到 数据 库 备 份 介质 中 ; 如 果 开 启 Include Log 参数 ， 
数据 库 日 志 也 会 一 同 保存 。 

图 7-7 中 ，DB2 备份 工具 上 有 4 个 方块 ， 分 别 是 数据 库 配 置 文件 、 数 据 库 表 衬 间 中 的 所 有 
数据 、 数 据 库 日 志文 件 以 及 数据 库 历史 记录 文件 。 

中 间 的 深 黑 色 框 代表 数据 库 备份 工具 ， 即 我 们 提 到 的 Backup 命令 。 

最 下 面 的 大 框 代 表 了 最 终 保存 的 数据 库 备 份 介质 ,其 中 包括 了 上 面谈 取 的 4 个 方块 的 信息 。 

那么 ， 生 成 的 数据 库 备 份 介质 是 什么 样子 呢 ? 实际 上 ， 数 据 库 备 份 介质 是 以 文件 的 形式 存 
储 在 磁盘 上 ， 如 图 7-8 Hr. 
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数据 库 配 置 文件 数据 库 表 空间 数据 库 日 志文 件 数据 库 历史 记录 文件 


Database Configuration File Database Tablespaces Database Log File Database Recovery History 


ir 灰 复 历 实 记 录 


数据 库 备 份 介质 


Database Backup Image 


图 7-7 ”数据库 备份 介质 生成 过 程 


Seb IEEE 
数据 库 实 例 名 称 mRRPE ORIGINE 
— db21ael. .caTN0000 ]|20110406214833]. 
EELSESGETAG RUNI 14 H6H 
NODEOOCI. NODEOCOZAS 21£aszb33€Xé 


图 7-8 ”数据 库 备份 介质 文件 名 格式 


在 图 7-8 "P, SAMPLE 是 数据 库 名 字 ，db21lde a NODE0000 为 当 
六 数据库 节点 名 字 。 如 果 我 们 仅仅 使 用 单 分 区 数据 库 ， 那 么 名 字 总 是 NODE0000, 在 多 分 区 下 ， 
根据 节点 的 多 少 会 出 现 NODE0001 或 NODE0002 RAM 的 编号 。20110406214833 指 的 是 
备份 的 时 间 ， 其 格式 为 YYYYMMDDHHMMSS。 末 尾 的 001 是 备份 介质 的 编号 ， PA T R 
使 用 多 个 备份 路 径 时 ， 如 backup db SAMPLE to /db2 1, /db2 2 时 ， 会 产生 2 个 备份 介质 ， 编 
号 分 别 为 001 和 002. 

数据 库 备 份 的 原理 虽然 比较 简单 ， 但 是 备份 过 程 会 对 生产 系统 产生 一 定 影响 ， 因 此 通 名 只 
能 选择 在 相应 的 维护 窗口 进行 ， 为 了 充分 地 利用 系统 资源 ， enii 
此 必须 制定 合理 的 备份 策略 ， 快 速 而 高 效 地 备份 。 

1. 选择 备份 方式 


根据 业务 系统 能 否 中 断 ， 可 以 选择 是 进行 离线 备份 还 是 在 线 备 份 ， 如 采 在 维护 窗口 ， 人 允许 
业务 中 断 ， 可 以 选择 进行 离线 备份 ， 离 线 备 份 时 不 允许 业务 访问 数据 库 ， 但 是 备份 速度 较 快 。 
如 条 应 用 不 允许 中 断 ， 束 必须 选择 在 系统 压力 较 少 的 时 候 进 行 在线 备 份 Online Backup). T- 
人 下面 通过 两 个 简单 的 实例 来 学 习 如 何 进行 离线 备份 和 在 线 备 份 。 
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首先 切换 到 数据 库 管理 员 用 户 ， 当 前 为 db2lde， 进 行 数 据 库 离线 备份 : 


db2 backup db SAMPLE to /db2/db21de COMPRESS 


Backup successful. The timestamp for this backup image is : 20110407064154 


HF, SAMPLE 表示 当前 所 备份 的 数据 库 名 字 ， 关 键 字 to 指定 了 备份 介质 的 存储 位 置 为 
/db2/db21de 目录 ，COMPRESS 指定 对 当前 的 数据 库 备 份 介质 进行 压缩 。 

接 下 来 进行 数据 库 在 线 备份 ， 在 线 备 份 命令 与 离线 备份 命令 的 区 别 在 于 需要 在 备份 命令 中 
加 入 online 关键 字 。 与 离线 备份 相同 ，SAMPLE 是 备份 的 数据 库 名 ， 关键 字 to 指定 了 备份 介质 
存储 的 位 置 ， 而 COMPRESS 参数 指定 启用 压缩 ， 实 际 命令 如 下 : 

db2 backup db SAMPLE online to /db2/db21de COMPRESS 

Backup successful. The timestamp for this backup image is : 20110727190638 
人 注意 : DB2 在 线 备份 

在 线 备 份 时 ， 数 据 库 必 须 处 于 归档 模式 下 才能 进行 。 


2. 选择 备份 对 象 


为 了 所 高 备份 速度 ， 可 以 根据 业务 特点 选择 合适 的 备份 对 象 来 减少 需要 备份 的 数据 。 

根据 备份 的 对 象 可 分 为 数据 库 备 份 和 表 空 间 备份 “Tablespace Backup) 。 数 据 库 备 份 是 对 
整个 数据 库 所 有 的 数据 所 做 的 备份 ， 而 表 空 间 备份 则 是 针对 菏 个 或 者 茶 些 经 癌变 化 而 义 比 较 重 
要 的 表 空 间 所 做 的 备份 。 如 条 数据 库 中 只 有 部 分 表 空 间 的 数据 经 向 变化 且 比 较 重 要 ， 而 其 他 表 
室 间 的 数据 基本 不 变 或 者 即使 丢失 ， 对 于 业务 的 影响 也 不 大 ， 这 个 时 候 就 没有 必要 备份 整个 数 
据 亩 ， 而 只 需要 针对 这 些 重要 而 经 常 变 化 的 表 空 间 进行 表 空 间 级 别 的 备份 ， 由 于 表 空 间 级 的 备 
份 较 数 据 库 备份 数据 量 较 少 ， 因 此 其 备份 和 恢复 的 时 间 也 会 相应 缩短 。 

3. 选择 备份 规模 


影响 备份 速度 的 另 一 个 重要 因素 是 备份 规模 ， 根 据 业 务 的 需要 和 最 小 恢复 时 间 的 要 求 ， 合 
理 地 选择 备份 规模 ， 可 以 有 效 地 降低 备份 过 程 对 于 业务 的 影 啊 。 

根据 备份 的 规模 可 以 分 为 全 备 〈Full Backup). 和 增 量 备份 (Incremental Backup) ， 完 全 备 
份 是 对 数据 库 或 表 空 间 的 所 有 数据 所 做 的 备份 ， 而 增 量 备份 是 对 上 一 次 备份 以 来 变化 的 数据 所 
做 的 备份 , 增 量 备份 义 可 以 分 为 累积 增 量 备份 (Cumulative Backup ) 和 Delta 备份 (Delta Backup). 
如 图 7-9 所 示 ， 累 积 增 量 备份 是 包含 从 上 一 次 全 备 以 来 的 所 有 数据 ， 中 间 可 能 有 多 次 累积 增 量 
备份 ， 而 Delta 备份 只 包含 上 一 次 备份 以 来 变化 的 数据 ， 如 图 7-10 所 示 。 

完全 备份 由 于 需要 备份 整个 数据 库 或 者 表 空 间 ， 数 据 量 比 较 大 ， 因 此 备份 的 时 间 较 长 ， 不 
过 使 用 完全 备份 进行 恢复 时 ， 其 需要 的 恢复 时 间 较 短 ， 而 增 量 备 份 只 需要 备份 部 分 数据 ， 相 比 
完全 备份 ， 其 数据 量 较 小 ， 可 以 快速 完成 备份 ， 但 是 恢复 时 ， 通 笛 需 要 较 长 的 恢复 时 间 ， 为 了 
同时 满足 较 快 的 备份 和 最 小 恢复 时 间 的 要 求 ， 通 利 会 采用 完全 备份 和 增 量 备份 结合 的 方式 ， 即 
根据 业务 的 特点 ， 选 择 每 周 或 者 每 月 进行 一 次 完全 备份 ， 而 每 天 进行 Delta 增 量 备份 ， 每 几 天 
进行 一 次 累积 的 增 量 备份 方式 。 


第 7 章 配置 参数 与 运 维 工具 优化 


SE Em ONU UE 


图 7-9 增 量 备份 


星期 日 星期 一 星期 二 星期 三 星期 四 星期 五 星期 六 


Delta Delta 备 Delta 备 Delta 备 Delta 备 Delta 备 


图 7-10 Delta 备份 


FRR 小 技巧 : IBM 的 MergeBackup 工具 很 38 7 
在 一 些 特殊 的 情况 下 ， 由 于 业务 量 大 ， 采 用 增 量 备份 时 ， 不 能 满足 最 小 恢复 时 间 的 
要 求 ， 而 系统 由 于 业务 的 压力 又 没有 足够 的 维护 窗口 来 进行 完全 备份 ， 这 个 时 候 ， 就 可 
以 使 用 IBM 提供 的 MergeBackup 工具 ， 它 可 以 在 不 影响 业务 系统 的 基础 上 ， 合 并 旧 的 
完全 备份 和 其 后 的 增 量 备份 为 新 的 完全 备份 ， 从 而 在 不 增加 维护 窗口 的 前 提 下 ， 保 证 最 
小 恢复 时 间 的 要 求 。 


4. 选择 备份 参数 


在 制定 正确 的 备份 策略 的 基础 上 ， 还 可 以 通过 选择 合适 的 备份 参数 来 进一步 优化 备份 的 速 
度 ， 以 下 参数 可 以 用 来 调整 备份 性 能 : 


BACKUP DATABASE «DB» TO dir | dev WITH num-buf BUFFERS 
BUFFER buff-size PARALLELISM n COMPRESS 


(1) To dir | dev 

如 果 有 多 个 目标 路 径 被 指定 ， 如 dirl, dir2. dir3 等 ， 这 样 会 有 多 个 db2med〈 备 份 和 恢复 
介质 控制 器 ) 进程 并 行 地 向 dirl, dir2. dir3 等 多 个 路 径 同 时 写 入 数据 。 

如 有 末 系 统 中 有 多 个 磁盘 系统 ， 可 以 使 用 多 个 目标 路 径 分 别 指 癌 这 些 磁 盘 系 统 ， 以 序 分 利用 
多 个 磁盘 系统 的 并 行 能 力 。 

(2) WITH num-buf BUFFERS 

每 一 个 备份 过 程 可 以 拥有 一 个 或 者 多 个 内 部 绥 存 。 将 内 部 缓存 的 数目 设置 为 db2med 进程 
数目 的 2 倍 以 上 可 以 提升 性 能 ,因为 这 使 得 db2med 进程 向 外 部 磁盘 写 入 数据 时 无 须 等 待 缓存 。 

需要 注意 的 是 ，(Cbuff-size) X (num-buf) 的 值 需要 小 于 UTIL HEAP SZ.UTIL HEAP SZ 
指定 了 DB2 中 实用 程序 堆 的 大 小 ， 此 参数 决定 备份 、 恢 复 和 LOAD 命令 可 以 同时 使 用 的 最 大 
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内 存量 。 

(3) BUFFER buff-size 

使 用 BUFFER buff-size 参数 可 以 指定 内 部 缓存 的 大 小 ， 单 位 为 4KB。 如 果 BUFFER 的 人 
没有 指定 ， 则 使 用 DBM 中 的 参数 BACKBUFSZ 作为 内 部 缓存 的 大 小 。 进 行 备份 时 ， 数 据 首 先 
由 表 空 间 写 入 内 部 缓存 ， 当 绥 存 满 后 ， 绥 存 中 的 数据 会 被 写 入 到 外 部 目标 磁盘 中 。 

BUFFER 值 的 大 小 建议 设置 为 表 空间 EXTENTSIZE 大 小 的 整数 倍 。 如 果 不 同 表 空 间 的 
EXTENTSIZE 大 小 不 同 ， 则 BUFFER 值 建议 为 它们 的 最 小 公 倍 数 。 

(4) PARALLELISM n 

PARALLELISM 参数 指定 了 db2bm (备份 和 恢复 缓冲 区 操纵 程序 ) 进程 数目 ， 它 决定 了 从 
表 空 间 写 入 系统 缓存 的 并 行 度 。 每 一 个 db2bm 进程 会 对 应 于 一 个 或 多 个 表 空 间 ， 当 一 个 db2bm 
进程 完成 对 当前 表 空 间 的 备份 后 ， 它 会 继续 对 男 外 一 个 表 空间 进行 备份 。 由 于 每 一 个 db2bm XE 
程 至 少 对 应 于 一 个 表 空 间 ， 因 此 ，PARALLELISM 值 需要 小 于 数据 库 表 空 间 的 数目 ， 如 果 将 
PARALLELISM 设置 为 大 于 数据 库 中 表 空 间 的 数目 ， 并 不 会 显 赦 提高 备份 的 性 能 。 


比较 : db2bm 进程 和 db2med 进程 


DB2 备份 和 恢复 主要 由 db2bm 进程 和 db2med 进程 共同 完成 ， 这 两 个 进程 均 在 db2agent 
的 协调 下 进行 工作 。 
e db2bm (备份 和 恢复 缓冲 区 操纵 程序 ) : 用 来 在 表 空 间 和 系统 缓存 间 进 行 数据 传输 ， 
它 需 要 通过 db2pfchr (缓冲 池 预 取 进 程 ) 从 容器 中 预 取 数据 ， 或 者 通过 db2pclnr (组 
冲 池 页 清除 程序 ) 向 容器 中 写 入 数据 。 
e  db2med (备份 和 恢复 介质 控制 器 ) : 用 来 在 系统 缓存 和 外 部 介质 之 间 进 行 数据 传输 。 


(5) COMPRESS 

DB2 使 用 的 是 一 种 改进 的 Lempel-Zev (LZ) 压缩 算法 ， 使 用 这 个 参数 能 减少 备份 文件 的 
大 小 ， 从 而 节省 磁盘 空间 ， 但 是 会 使 得 CPU 利用 率 提 高 。 

7.4.2 DB2 ARRE, IAR EME RRE SRE 

数据 库 恢 复 是 数据 库 备 份 的 道 过 程 ， 也 是 数据 库 备 份 的 目的 ， 如 果 不 需 要 恢复 数据 库 ， 也 
就 不 需要 备份 数据 库 ， 针 对 不 同 的 意外 情况 ，DB2 提供 了 不 同 的 恢复 方法 。 与 前 面 讲 的 数据 库 
备份 类 似 ，DB2 同样 集成 了 数据 库 恢 复工 具 CRestore Utility) ， 如 下 例 所 示 ， 首 先 执行 版 本 恢 
复 ， 再 执行 前 滚 恢复 : 


-- 版 本 恢复 

db2 restore db SAMPLE from /db2/db21lde taken at 20110407220438 
- - BI RKE 

db2 rollforward db SAMPLE to end of logs and complete 


那么 什么 是 版 本 恢复 ? 什么 是 前 深 恢 复 ? 从 图 7-11 可 以 看 到 , DB2 提供 三 种 恢复 方式 ， 即 
HRR (Crash Recovery)、 版 本 恢复 (Version Recovery) 和 前 深 恢 复 (Rollforward Recovery? . 
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灾难 恢复 前 滚 恢复 


baie T 
灾难 恢复 
Crash Recovery 


Tk 
Restore 


Rollforward 


E rs 
"my 


图 7-11 数据 库 恢 复方 式 


恢复 
备份 介质 。 Restore 


1. BB 


DB2 的 灾难 恢复 是 通过 定时 则 数据 库 目 录 中 的 日 忘 控制 文件 SQLOGMIR.LFH ù 
SQLOGCTL.LFH.1 和 SQLOGCTL.LFH.2 写 入 检查 点 ， 来 控制 朋 溃 恢复 。 在 DB2 重新 启动 后 ， 
会 根据 日 志文 件 的 内 容 将 已 经 落实 但 未 写 到 磁盘 上 的 事务 重新 写 到 磁盘 上 去 ， 而 将 所 有 未 落实 
事务 的 变更 回 退 到 变更 前 的 状态 ， 通 常 由 数据 库 自 动 进行 

2. 版 本 恢复 


图 7-12 描述 了 如 何 进行 版 本 恢复 ,即使 用 在 某 个 时 间 点 所 备份 的 备份 介质 , 把 当前 数据 库 
恢复 到 之 前 那个 时 间 点 的 数据 库 状态 (我 们 可 以 把 “版 本 恢复 ”理解 为 “时 间 点 恢复 ”) 。 这 
意味 着 从 之 前 那个 时 间 点 ,到 当前 时 间 点 的 数据 库 更 新 — 

将 被 丢弃 。 我 们 可 以 对 使 用 循环 日 志 的 数据 库 ( 即 没有 开 p 
启 归档 模式 的 数据 库 ) 使 用 此 方法 。 当 恢复 完成 后 , 数据 CO 
EAF Normal 状态， 我 们 无 须 再 进行 额外 的 操作 。 A 7-12 数据库 版 本 恢复 


3. 前 滚 恢 复 


上 自 和 完 使 用 备份 介质 将 数据 库 恢复 到 之 前 的 某 个 版 本 (相当 于 做 了 一 次 版 本 恢复 )， 再 根据 
归档 日 志 将 数据 库 恢 复 到 某 个 特定 的 时 间 点 ， 或 者 恢复 到 故障 前 的 状态 。 如 果 使 用 前 滚 恢复 ， 
则 数据 库 需 要 开启 归档 日 志 模 式 。 

图 7-13 摘 述 了 如 何 进 行 前 深 恢 复 : 使 用 在 线 备份 介质 恢复 完毕 后 , 数据库 处 于 Rollforward 
Pending 状态 ， 数 据 库 等 每 前 深 操 作 。 


Rollforward Pending 


图 7-13. 数据 库 前 滚 恢复 


接 下 来 , 使 用 Rollforward 命令 前 深 在 此 备份 介质 之 后 的 归档 日 志 , 将 数据 库 恢复 到 某 个 指 
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定 的 时 间 点 或 者 灾难 前 的 状态 。 

当前 深 恢 复 完 成 后 ， 我 们 需要 使 用 Rollforward Complete 命令 重 置 数据 库 状态 ， 将 数据 库 
由 Rollforward Pending JÄR AA Normal 状态 。 

在 进行 数据 库 恢复 与 前 深 时 , 数据库 恢复 工具 会 读 取 备份 恢复 历史 记录 文件 (db2rhist.asc)， 
来 决定 使 用 哪些 备份 介质 和 哪些 归档 日 六 进行 前 滚 恢复 。 

学 习 了 居 复 的 基本 原理 后 ， 下 面 重点 讲述 如 何 使 用 RESTORE 和 ROLLFORWARD 命令 进 
行 版 本 恢复 和 前 深 恢 复 。 

使 用 备份 介质 进行 版 本 恢复 ,命令 如 下 所 示 。 其 中 ，SAMPLE 为 我 们 需要 恢复 的 数据 库 名 
F, RET from 指定 了 备份 介质 所 在 的 目录 ， 关 键 学 taken at 指定 使 用 哪个 备份 介质 。 


[db2instlQ@db2 ~]$db2 restore db SAMPLE from /db2/db2lde taken at 20111105012931 
DB20000I The RESTORE DATABASE command completed successfully. 


AS SE PA EM A i n] EAE EE BRE ARAS Jos BA US P6 6e Jn RE B edn 
何 恢复 呢 ? ARZ Ea F ORE a AE BIET) BU TR DX ELO CHR T . 

版 本 恢复 结束 后 ,如 果 尝 试 连 接 SAMPLE 数据 库 会 发 现 数据 库 返 回 警告 信息 ,提示 当前 数 
据 库 处 于 ROLLFORWARD PENDING 状态 。 


[GD 工人 有 世人 52 el connect to SAMPLE 
SOL1117N A connection to or activation of database "SAMPLE" cannot be made 


because of ROLL-FORWARD PENDING. SQLSTATE-57019 


接 下 来 使 用 前 深 合 令 ROLLFORWARD 将 数据 库 恢 复 到 损毁 前 的 那 一 时 刻 。 其 中 ，SAMPLE 
是 当前 需要 进行 前 滚 的 数据 库 名 字 ， 关 键 字 to 指定 了 所 需 前 滚 的 时 刻 ，END OF LOGS 表示 期 
望 数 据 库 前 滚 至 最 后 一 个 日 志文 件 结束 ， 也 就 是 将 数据 库 前 滚 到 损毁 前 的 那 一 刻 。 


[db2insti8db2 -«]$db2 rollforward db SAMPLE to end of logs 


Rollforward Status 


Input database alias = SAMPLE 

Number of nodes have returened status = 1 

Node number = 0 

Rollforward status = DB working 

Next log file to be read = 50000003 , LOG 

Log files processed = 50000002. LOG = 50000003. LOG 
Last committeed transaction = 2011=07=27=11.24.42. 000000 UTC 


DB20000I The ROLLFORWARD command completed successfully. 


当前 深 结 束 后 ， 需 要 使 用 ROLLFORWARD COMPLETE 命令 结束 数据 库 的 ROLLFORWARD 
PENDING 状态 ， 使 数据 库 进 入 到 Normal 状态 。 如 下 所 示 。 


[do2insti8db2 ~]$db2 rollforward db SAMPLE complete 


Bolbtorwardo Status 


Input database alias = SAMPLE 
Number of nodes have returened status = 1 
Node number = 0 
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ROoLlforwaro status = not pending 

Next log file to be read = 

Log files processed = 60000002. LOG = 50000003. LOG 
Last committeed transaction = 2011=07=27=11.24.42. 000000 UTC 


DB20000I The ROLLFORWARD command completed successfully. 


用 户 也 许 是 由 于 数据 库 错 误 操 作 而 进行 的 数据 库 恢 复 ， 这 个 时 候 如 果 前 深 恢 复 到 END OF LOGS 
怠 会 重复 错误 的 操作 ， 在 这 种 情况 下 可 以 将 数据 库 前 滚 恢复 到 发 生 错 误 前 的 时 间 ， 如 下 所 示 : 


db2 rollforward db SAMPLE to 2011-07-27-10.23.42.000000 


上 面 讲 述 了 如 何 使 用 RESTORE 和 ROLLFORWARD 命令 进行 恢复 和 前 滚 。 但 是 当 使 用 增 
量 备 份 或 Delta 备份 (是 两 种 增 量 备 份 方式 ， 其 详解 见 7.4.1 小 节 ) 。 在 数据 库 恢 复 时 ， 不 得 不 
需要 执行 多 次 RESTORE 和 ROLLFORWARD 命令 ， 这 可 不 轻松 啊 ! 

例如 从 星期 日 到 星期 五 ,每 天 都 做 一 次 备份 ,备份 的 方式 包括 全 备份 、Delta 备份 和 增 量 备 
份 。 当 数据 库 在 星期 六 出 现 故 隧 需 复 时 ， 如 果 使 用 RESTORE 和 ROLLFORWARD 命令 进 
行 数据 库 恢 复 ， 恢 复 操 作 很 索 琐 : 需要 先 使 用 三 种 不 同 的 备份 介质 进行 数据 库 恢复 ， 再 使 用 星 
AU Eee se wa 期 六 故障 前 的 状态 

为 了 解决 这 个 问题 ，DB2 提供 了 RECOVER 恢复 命令 ，RECOVER 命令 相当 于 RESTORE 
和 ROLLFORWARD 命 个 人 的 组 全 ， 它 会 根据 数据 库 备 份 恢复 历史 记录 文件 确定 需要 使 用 哪些 备 
份 介质 和 数据 库 日 志 i 行 恢复 和 前 滚 ， 这 样 仅 需 一 条 RECOVER 命令 就 可 以 非常 容易 地 完成 数 
据 库 恢复 和 前 滚 了 。 

下 面 的 例子 讲解 RECOVER 命令 的 用 法 : 


[Gl521 PSELQel52 el recover GD SAMPLE 


Rollforward Status 


Input database alias = SAMPLE 

Number of nodes have returened status = 1 

Node number = 0 

Rollforward status = not pending 

Next log file to be read = 

Log files processed = S0000004.LOG = S0000004.LOG 
Last committeed transaction = 2011=07=27=21.45.30,.000000 Local 


DB20000I The RECOVER command completed successfully. 


命令 结束 后 ， 查 看 恢复 之 后 数据 ， 可 以 发 现 完全 备份 之 后 更 改 的 数据 也 可 以 看 到 。 

掌握 了 恢复 基本 操作 ， 通 过 应 用 以 下 恢复 时 的 最 佳 实践 ， 能 够 优化 恢复 过 程 : 

执行 恢复 操作 时 ，DB2 将 自动 为 绥 冲 池 个 数 、 绥 冲 池 大 小 和 并 行 性 设置 最 佳 值 。 此 值 根据 
实用 程序 堆 内 存 的 数量 、 可 用 处 理 器 数 和 数据 库 配 置 而 定 。 因 此 ， 根 据 系 统 中 可 用 的 存储 量 ， 
应 考虑 通过 增 大 UTIL HEAP SZ 配置 参数 来 分 配 更 多 内 存 。 

虽然 DB2 恢复 操作 是 自动 调 优 的 ， 但 是 根据 实际 情况 调整 以 下 参数 可 以 提高 恢复 的 性 能 : 


RESTORE DATABASE «DB» FROM dir | dev WITH num-buf BUFFERS 
BUFFER buff-size PARALLELISM n 
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(1) FROM dir | dev 
如 采 指 定 多 个 备份 存储 路 径 〈 取 决 于 备份 时 目标 路 径 的 数目 ) ， 如 dil. dir2. dir3 等 ， 这 
样 会 有 多 个 db2med 进程 并 行 地 将 数据 从 外 部 介质 写 入 内 部 组 在 ， 避 免 使 LO Www ia 
超 负 和 荷 ， 能 够 缩短 完成 一 次 恢复 操作 所 需 的 时 间 。 
(2) WITH num-buff BUFFERS 
指定 使 用 的 内 部 缓存 大 小 ， 与 备份 参数 相同 ， 其 最 好 设置 为 db2med 进程 数目 的 2 倍 以 提 
高 恢复 速度 。 
(3) BUFFER buf-size 
BUFFER buf-size 的 大 小 为 一 块 内 部 缓存 的 大 小 ， 其 应 该 设置 为 表 空 间 EXTENTSIZE 大 小 
的 整数 倍 。 如 果 没 有 设置 的 话 , 则 使 用 DBM 配置 中 的 RESTBUFSZ 参数 作为 内 部 缓存 的 大 小 。 
(4) PARALLELISM n 
与 DB2 备份 命令 相同 ，PARALLELISM 参数 用 来 指定 恢复 过 程 中 的 db2bm 进程 的 数目 ， 
通过 增加 PARRALLELISM 值 可 以 提高 内 部 缓存 和 表 衬 间 之 间 数 据 交 换 的 并 行 性 。 
如 采 一 个 表 包 含 大 量 的 长 型 字段 和 LOB 数据 ， 那 么 恢复 它 会 占用 非常 多 的 时 间 。 通 过 将 
长 型 字段 和 LOB 数据 存储 在 单独 的 表 空 间 中 ， 不 选择 恢复 包含 该 长 型 字段 和 LOB 数据 的 表 空 
间 ， 可 以 减少 完成 恢复 操作 所 需 的 时 间 。 


人 注意 : 包含 长 型 字段 或 LOB 字段 表 
对 于 包含 长 型 字段 和 LOB 数据 的 表 ， 在 第 规 类 型 数据 和 长 型 字段 或 LOB 数据 存储 


在 不 同 的 表 空间 的 情况 下 ， 如 果 只 备份 包含 常规 类 型 数据 的 表 空 间 ， 而 未 备份 包含 相关 
的 长 型 字段 或 LOB 字段 的 表 空 间 , 那 么 不 能 对 包含 常规 数据 的 表 空间 执行 时 间 点 前 滚 恢 
复 ， 要 执行 时 间 点 恢复 ， 必 须 将 一 个 表 的 所 有 表 空 间 同 时 前 滚 至 同一 个 时 间 点 。 


7.5 j&s!E LR.BJ SR v 


is?E LHJdE^EP" RESIT, SHAMHAIL, A F EAS SEU NV FHIII Bite P SERE 
地 运行 这 些 运 维 工 具 ，DB2 提供 了 不 同 级 别 的 调 速 策 略 ， 下 面具 体 讲 述 。 
1. 使 用 UTIL IMPACT LIM 数据 库 管 理 器 配置 参数 定义 总 体 策略 


例如 ， 可 以 通过 下 面 的 get dom cfe 命令 获取 UTIL IMPACT LIM 的 当前 设置 ， 当 前 值 为 
20， 这 说 明 DBA 期 望 运行 所 有 运 维 工 具 的 工作 负载 之 和 不 会 超过 系统 总 负载 的 20%。 


El 
ae > 


通常 情况 下 UTIL IMPACT LIM 这 个 参数 设置 为 0~100 之 则 的 一 个 合理 值 ， 如 果 设 置 为 
100, 那么 不 局 用 调 速 ， 从 而 允许 运 维 工 具 可 以 利用 所 有 资源 。 如 来 发 现 运 维 工 具 运 行 的 时 间 过 
长 ,那么 可 以 考 碟 增 大 UTIL IMPACT LIM 的 值 , 甚 全 可 以 将 UTIL IMPACT LIM 设置 为 100。 
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例如 ， 使 用 下 面 的 命令 将 UTIL IMPACT LIM 参数 从 20 改 为 S0， 这 样 运行 所 有 运 维 工具 
的 工作 负载 之 和 不 会 超过 系统 总 负载 的 50%. 


[eism sre Ua | OOO me fo os mr MC 


2. 在 运 维 工具 中 指定 UTIL IMPACT. PRIORITY 选项 


除了 UTIL IMPACT LIM 参数 外 , 有 时 候 还 需要 为 不 同 的 运 维 工具 指定 不 同 的 优先 级 ， 这 
需要 在 命令 中 设置 UTIL IMPACT PRIORITY 选项 来 完成 。 

UTIL IMPACT PRIORITY 选项 的 范围 为 0~100， 其 值 设 置 为 正 数 ， 表 示 将 受 UTIL_ 
IMPACT _ LIM 参数 的 限制 ， 并 且 运 行 在 调 速 模式 下 ， 其 中 1 表示 最 低 优先 级 ，100 表示 最 高 优 
先 级 。 如 果 在 命令 中 不 指定 UTIL IMPACT PRIORITY 选项 , 那么 工具 不 再 受 UTIL IMPACT 
LIM 参数 的 限制 ， 而 将 运行 在 非 调 速 模式 ， 从 而 可 以 使 用 系统 的 所 有 资源 。 

例如 ， 下 面 的 BACKUP 命令 通过 UTIL IMPACT PRIORITY 选项 指定 的 优先 级 为 30: 


BACKUP DATABASE PROD TO /backup UTIL IMPACT PRIORITY 30 


例如 ， 下 面 的 BACKUP 命令 没有 使 用 UTIL IMPACT PRIORITY 选项 ， 那 么 将 运行 在 非 
调 速 模式 下 : 


BACKUP DATABASE PROD TO /backup 


3. UTIL IMPACT PRIORITY 配置 参数 定义 特定 运 维 工具 的 优先 级 


除了 在 运 维 工 具 中 使 用 UTIL IMPACT PRIORITY 选项 外 ， 还 有 一 种 更 方便 的 方式 ， 即 在 
运行 中 动态 调整 多 个 工具 的 优先 级 ， 有 具体 命令 的 语法 如 下 所 示 : 


SET UTIL IMPACT PRIORITY FOR <utility=id> TO <priority> 


其 中 ，utility-id 为 运 维 工具 在 运行 时 的 ID， 可 以 通过 list utilities 命令 列 出 ; priority 用 来 
定义 指定 运 维 工具 的 优先 级 ， 范 围 为 0~100， 有 具体 含义 如 下 : 

C1) priority 的 值 从 0 改 为 正 数 ， 那 么 将 从 非 调 速 方式 进入 调 速 方式 ， 将 受 UTIL_ 
IMPACT_LIM 参数 的 限制 ， 性 能 将 会 受到 限制 。 

(2) priority 的 值 从 正 数 改 为 0， 那 么 从 调 速 方式 进入 非 调 速 方式 ， 将 不 再 受 UTIL_ 
IMPACT LIM 参数 的 限制 ， 可 以 使 用 系统 的 所 有 资源 ， 基 有 最 好 的 性 能 。 

(3) priority 的 值 增 大 ， 优 先 级 变 高 ， 反 之 ， 优 先 级 变 低 ， 当 然 也 会 继续 受 UTIL_ 
IMPACT LIM 参数 的 限制 。 

例如 ， 下 面 使 用 list utilities 命令 列 出 了 当前 系统 正在 运行 的 运 维 工具 。 其 中 , ID 为 1 的 是 
RUNSTATS 操作 ，Priority 为 60; ID 为 2 的 是 BACKUP 操作 ，Priority 为 30。 可 以 看 出 ， 运 行 
RUNSTATS 操作 的 优先 级 要 比 BACKUP Fio 


[co 2 um essi dal erect des tub I bu EM OS 
ID-2 1 

Type - RUNSTATS 

Database Name - PROD 


Description = krrose.some table 
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Start Time = 07/19/2013 17:30:09.521324 
Priority = 60 

ID = 2 

Type - BACKUP 

Database Name - PROD 

Description = online db 

Start Time = 07/19/2013 17:32:09.622395 
State = Executing 

Invocation Type = User 

Throttling s 

Priority = 30 


为 了 加 快 它 们 的 执行 速度 ,将 RUNSTATS 操作 退出 调 速 模式 (priority 567 0) , K BACKUP 
操作 的 优先 级 从 30 增加 到 70， 如 下 命令 所 示 : 


本 
ee 


使 用 list utilities 命令 再 次 检查 它们 的 运行 情况 ， 从 下 面 的 输出 可 以 看 出 已 经 成 功 完 成 了 更 
改 ， 这 样 它们 的 性 能 将 会 显著 提高 : 


pow sud ls 


Type — RUNSTATS 
Database Name = PROD 

Description = krrose.some table 

Start Time = 07/19/2013 17:30:09.521324 
Priority = Unthrottled 

ID = 2 

Type - BACKUP 

Database Name - PROD 

Description = online db 

Start Time = 07/19/2013 17:32:09.622395 
State = Executing 

Invocation Type = User 


Tharottlings 


Priority = 70 


人 注意 : 都 有 哪些 运 维 工具 或 操作 支持 调 速 
目前 支持 调 速 策略 的 运 维 工 具 不 多 ， 仅 有 2 种 ， 分 别 是 RUNSTATS 和 BACKUP. 
另外 ， 表 空间 重 平 衡 操 作 和 异步 索引 清除 (AIC ) 操作 也 支持 调 速 。 


7.6 小结 


本 章 首 先 从 操作 系统 参数 设置 优化 开始 ， 讲 解 了 配置 参数 优化 ,包括 操作 系统 参数 、DBM 
参数 、DB 参数 和 DB2 注册 变量 的 设置 与 优化 。 接 下 来 讲解 了 数据 库 优 化 的 种 用 工具 ， 包 括 统 
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计 信 息 收集 、 表 和 索引 的 重组 以 及 包 的 重新 绑 定 ， 通 过 以 上 操作 ， 使 得 数据 库 执行 引擎 能 够 正 
确 而 局 效 地 运行 。 然 后 介绍 了 DB2 提供 的 各 种 数据 移动 工具 及 其 应 用 场景 和 优化 ， 以 帮助 读者 
能 够 在 实际 应 用 中 有 灵活 而 高 效 地 移动 目 己 的 数据 。 夯 外 ， 还 介绍 了 备份 和 恢复 工具 的 使 用 与 优 
化 ， 这 是 数据 库 安全 的 重要 保证。 最 后 ， 讲 解 了 运 维 工 具 的 调 速 策略 ， 这 是 业务 能 稳定 运行 的 
可 徘 你 证 。 
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提起 并 发 ， 大 家 并 不 陌生 ， 但 是 许多 DBA 并 不 清楚 如 何 实现 真正 高 效 的 数据 库 并 发 ， 甚 
至 有 人 说 : “我 们 已 经 配备 了 当前 最 强劲 的 和 硬件， 怎么 系统 跑 得 比 蜗牛 还 慢 ? ” 

本 章 将 解答 上 述 问 题 ， 主 要 内 容 包 括 : 如 何 设 置 合理 的 隔离 级 才能 使 并 发 最 大 化 ， 如 何 避 
免 死 倘 和 不 必要 的 锁 冲突 ， 当 出 现 未 预期 的 锁 问 题 时 ， 如 何 快速 处 理 ; DB2 的 锁 和 Oracle 的 
锁 到 底 有 哪些 区 别 。 

数据 库 中 最 重要 的 就 是 数据 ， 日 志 是 实现 数据 安全 的 重要 机 制 ， 本 章 还 将 深入 探讨 DB2 
日 志 原 理 以 及 最 佳 实践 。 


483 锁 和 日 志 优 化 


8.1 DB2 锁 机 制 解 析 


锁 ， 在 生活 中 和 每 一 个 优 县 相关 ， 小 到 抽 敢 锁 、 保 险 柜 锁 ， 大 到 防 资 门 锁 、 车 锁 ， 在 生 
活 中 发 挥 着 无 可 替代 的 作用 。 
同样 ， 锁 在 数据 库 中 也 发 挥 着 无 可 替代 的 作用 。 为 了 让 多 个 用 户 并 发 访问 数据 库 对 象 时 能 
同时 保持 数据 一 致 性 ，DB2 采用 了 锁 机 制 ， 当 然 DB2 中 的 锁 要 比 生活 中 的 锁 更 复 灵 。 
A 注 意 : 锁 的 概念 
锁 实际 上 是 DB2 中 的 一 个 数据 结构 ， 锁 的 结构 包括 : 
© *|$ (object): 包括 行 、 表 、 数 据 块 、 表 空间 和 索引 。 最 重要 的 是 行 和 表 上 的 锁 。 
e 大 小 (size 指 锁 的 粒度 ， 其 中 行 级 别 的 锁 粒 度 最 小 。 在 这 里 ， 可 以 把 粒度 理 
解 为 被 锁定 的 数据 范围 。 粒 度 越 小 ， 被 锁定 的 数据 范围 就 越 小 。 
e 时 间 长 度 (duration: 即 锁 从 获取 到 释放 所 经 历 的 时 间 。 
@ 模式 (mode) 规定 了 锁 和 其 他 锁 的 兼容 性 ， 即 当 某 个 对 象 已 被 某 种 锁 锁 定时 ， 
其 他 哪 种 类 型 的 锁 请 求 可 以 被 满足 。 


8.1.1 没有 锁 会 发 生 什 么 


锁 是 为 了 保证 事务 的 一 致 性 ， 而 事务 是 由 一 个 或 多 条 SQL 组 成 的 工作 单元 。 这 些 SQL 被 
视 为 一 个 整体 , 如 果 都 执行 成 功 , 执行 的 结果 束 在 数据 库 中 生效 ; 如 果 任 何 一 条 SQL 执行 失败 ， 
则 整个 工作 单元 被 回 深 ， 也 束 是 说 ， 已 经 执行 成 功 的 SQL 对 数据 做 的 改动 也 将 被 撤销 。 

实际 上 ， 如 果 没 有 锁 机 制 的 保护 ， 事 务 一 致 性 耽 无 法 得 到 保卫 ， 将 引起 丢失 更 新 、 脏 该 、 
不 可 重复 谈 和 幻影 该 等 现象 。 为 了 便于 该 者 更 好 的 理解 这 四 种 现象 ， 我 们 以 银行 系统 中 两 个 事 
务 同 时 访问 账户 信息 表 account 为 例 ， 看 看 没有 锁 的 话 ， 会 出 现 哪些 现象 。 

1. 丢失 更 新 (Lost Update) 


当 多 个 事务 同时 对 一 行 数据 进 行 修改 操作 时 ， 上 只 有 最 后 一 个 事务 的 修改 被 保留 下 来 ， 其 他 
事务 的 修改 都 会 丢失 。 如 图 8-1 所 示 ， 事 务 1 和 事务 2 同时 更 新 账户 信息 表 中 id 为 1004 的 账 
写 ， 当 前 值 为 2000。 当 事务 1 用 它 的 新 值 更 新 该 行 以 后 Cbalance-2000-5000 ， 事 务 2 又 更 新 
了 同一 行 balance=2000+1000) ， 事 务 1 提交 后 ， 事 务 2 提交 。 则 事务 1 所 执行 的 更 新 操作 残 
AEk, KATEZ 2 更 新 的 结果 ， 即 最 终 balance 的 值 被 更 新 为 3000〈 即 2000+1000) ， 而 
不 是 用 户 期 望 的 3500( 即 2000+500+1000) 。 


2. Pi (Dirty Read) 


所 谓 “ 脏 谈 ” 指 的 是 一 个 事务 会 谈 到 另 一 个 事务 未 提交 的 数据 。 所 谓 “ 未 提交 数据 ”， 是 
指 被 修改 但 是 还 未 被 提 区 的 数据 ， 它 们 有 可 能 被 回 浚 恢复 到 原 值 。 如 图 8-2 所 示 ， 事 务 1 把 ID 
为 1004 的 balance 值 增加 500, BB balance=2000+5$00， 但 是 还 未 提交 ; 此 时 事务 2 开始 查询 ID 
为 1004 的 balance 值 ， 谈 到 的 值 是 2300。 但 是 ， 事 务 1 决定 回 深 ， 撤 销 更 狐 。 这 样 ID 为 1004 
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的 balance 实际 值 是 2000， 而 事务 2 读 到 的 并 非 正 确 值 。 


事务 1 事务 2 
' 1. Update account | ! 2. Update account | 
Set balance = balance + 500 Set balance = balance + 1000 | 
Where id — 1004 | | Where id — 1004 


1004 John 2000 
1005 Jim 5000 


图 8-1 丢失 更 新 示例 


i ad ——Á— HM ! 
! 2. Select balance 


' Set balance = 
ı From account 


balance + 500 | i . 
! Where id = 1004 


! Whereid =1004 | Le 


2000 


3000 


图 8-2” 脏 读 示 例 


3. 不 可 重复 读 (Non Repeatable Read) 


一 个 事务 中 两 次 恋 同 一 数据 时 ， 由 于 在 两 次 谈 之 间 ， 其 他 事务 修改 了 这 个 数据 ， 造 成 该 事 
务 中 两 次 读 到 的 结果 不 同 。 如 网 8-3 所 示 ， 事 务 1 恋 取 了 一 行 数 据 (balance=2000) ， 而 此 时 事 
务 2 更 改 了 该 行 Cbalance-2000-5000 ， 并 立刻 提交 了 更 改 。 当 事务 1 再 次 恋 取 该 行 时 ， 却 该 
到 了 与 上 次 不 同 的 值 (balance=2500)。 对 事务 1 来 说 ， 两 次 读 到 的 信息 产生 了 不 一 致 现象 。 


I-----------------" 


d. Select balance 
| 2. Update account | 
! From account 


! Where id = 1004 : Set balance = 


balance- 
| o | nme | omae | 

[oe [oue [ow | 

l ios | som | 2mo A 

| i3, Commit 


4, Select balance 


I 
From account 


Where id — 1004 


图 8-3 ”不 可 重复 读 示 例 
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4. 幻影 读 (Phantom Read) 


一 个 事务 中 两 次 读 到 的 结果 的 行 数 不 一 样 。 第 一 次 读 操作 后 ， 由 于 其 他 事务 做 了 插入 、 修 
改 或 删除 数据 行 的 操作 ， 而 使 符合 查询 条 件 的 数据 行 数 发 生 了 变化 ， 该 事务 再 次 执行 同样 的 读 
操作 ， 束 会 发 现 结果 集 的 大 小 增加 了 。 如 图 8-4 所 示 ， 事 务 1 读 取 到 满足 查询 条 件 Balance>0 
的 3 行 数据 后 , 事务 2 插入 了 符合 此 查询 条 件 的 新 行 并 进行 提交 。 此 时 事务 1 中 的 第 二 次 查询 ， 
将 会 读 到 4 行 数据 ， 即 结果 集 增 大 了 。 


[o et dei eed mt | 


' 1. Select balance ' 事务 2 


1 2. Insertinto —— 
From account 1 


Where Balance > 0 | | account | 
| | Values( 1006, | 
'Amanda', | 
| ID | Name | Bde | 1000) 

| 1003 Mike 1000 | 

[am | om | 20 | 

| oos f im | so | 

| os | amma | nm f 


3. Commit 


| 4. Select balance 


From account 


lo 


Where Balance» 0 ; 


比较 : 不 可 重复 读 和 幻影 读 有 什么 区 别 ? 


不 可 重复 读 和 幻影 读 都 是 执行 同样 查询 却 得 到 不 同 结果 的 现象 。 

在 不 可 重复 读 现象 中 ， 第 二 次 读 的 数据 相 较 第 一 次 发 生 了 值 的 改变 ， 但 结果 集 的 大 小 并 没 
有 改变 。 这 种 现象 是 由 于 其 他 事务 修改 (Update) 了 该 事务 第 一 次 读 到 的 数据 行 所 和 致 。 

在 幻影 读 现象 中 ， 用 同样 的 查询 条 件 第 二 次 读 取 数据 时 ， 结 果 集 大 小 发 生 了 变化 ， 这 是 由 
于 修改 了 其 他 非 结 果 集 的 数据 或 者 插入 新 的 数据 行 符合 当前 条 件 , 导 致 结果 集 的 数量 变 大 所 和 致 。 


根据 业务 逻辑 的 要 求 ， 用 户 一 般 不 希望 看 到 上 述 一 种 或 多 种 现象 出 现 ， 为 此 ，DB2 使 用 了 
锁 机 制 。 有 了 锁 机 制 后 ， 应 用 程序 对 数据 库 对 象 进行 操作 时 ，DB2 会 对 相关 的 数据 库 对 象 加 相 
应 类型 的 锁 。 这 样 ， 操 作 同 一 对 象 的 事务 只 有 取得 锁 后 才能 进行 相关 操作 ， 最 终 使 执行 结 采 满 
足 事务 一 致 性 的 要 求 。 


8.1.2 锁 的 类 型 和 兼容 性 


为 了 保证 业务 逻辑 对 事务 一 致 性 的 要 求 ， 同 时 尽 可 能 地 保持 最 大 并 发 能 力 , DB2 设计 了 很 多 
类 型 的 锁 。 每 个 刚 学 习 DB2 的 人 ， 都 会 觉得 DB2 锁 的 类 型 很 多 ， 如 Ss. IS. X. IX. SIX. NX. 
U、Z 和 等， 名字 上 看 区 别 不 大 ， 因 此 感觉 比较 复杂 。 其 实 ， 只 要 能 都 弄 懂 它 们 的 含义 束 行 了 。 

生活 中 锁 有 不 同 的 粒度 , 比如 小 的 保险 柜 锁 和 大 的 防盗 门 锁 。 DB2 中 的 锁 也 有 不 同 的 粒度 ， 
可 以 分 为 表 锁 和 行 锁 ， 下 面具 体 讲述 。 
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1. xS 
DB2 中 有 8 PRM, WK 8-1 所 示 。 


48-1 R 


表 锁 名 说 明 
IN TZA CIntent None) 
IS 意 回 共享 锁 〈JIntent Share? 
IX x IH) HET. BE CIntent eXclusive ) 
SIX "hr TET E REA (Share with Intent eXclusive) 


共享 锁 (Share) 

排他 锁 (eXclusive) 

EA (Update) 

RHEA Csuperexclusive? 


N |C Ix a 


下 面 是 每 种 表 锁 的 具体 含义 。 

e TANA ON): 事务 一 般 是 为 了 读 取 表 中 的 数据 (包括 其 他 事务 尚未 提交 的 数据 》， 
而 且 无 意 对 表 进 行 修改 而 加 此 表 锁 。IN 锁 一 般 用 于 “未 提交 谈 ”《 可 谈 取 未 提交 的 数 
据 ) 这 一 隔离 级 。 

e ARFA AS): 事务 为 了 读 取 表 中 部 分 数据 行 而 加 IS 锁 。 锁 需要 与 行 锁 配 合 ， 对 
应 的 行 锁 可 以 是 $ 或 NS 锁 。 

e 意 问 排他 锁 AX): 事务 为 了 读 取 和 修改 表 中 的 部 分 数据 行 而 加 此 锁 。IX 锁 需 要 与 行 
锁 配 合 : 对 于 读 操 作 ， 对 应 的 行 锁 可 以 是 S 锁 、NS 锁 、X 锁 或 U Bt; 对 于 更 新 操作 ， 
对 应 的 行 锁 是 X 锁 。 

e 市 排他 意 回 的 共享 锁 〈SIX) : 事务 为 了 读 取 整个 表 ， 并 修改 其 中 的 部 分 数据 行 而 加 此 
锁 。SIX 锁 对 于 更 新 操作 ， 需 要 X 行 锁 配合 ， 而 对 于 读 操作 不 需要 行 锁 配合 。SIX 锁 
的 获得 比较 特殊 ， 它 是 在 事务 已 经 拥有 IX 锁 的 情况 下 ， 请 求 $ 锁 ; 或 者 是 已 经 拥有 SS 
BITE TU P. SOR IX 锁 时 生成 的 。 

人 注意 ;为 什么 要 有 意向 锁 ? 
意向 (intent ) 锁 是 对 非 意 向 锁 的 一 种 补充 。 意 向 锁 要 弱 于 对 应 的 非 意 向 锁 。 这 里 说 

的 强 弱 ， 指 的 是 对 表 锁 的 严格 程度 。 例 如 ， 对 一 张 表 加 锁 ，IX 是 比 X 稍 弱 的 锁 ， 这 是 

因为 IX 代表 了 表 中 的 一 部 分 行 被 锁 住 ， 而 X 表示 整个 表 的 所 有 行 被 锁 住 。 芒 5 IX 是 

兼容 的 ， 因 为 它们 可 以 代表 对 同一 个 表 中 的 不 同行 进行 了 锁定 ; 而 X 与 X 和 IX 锁 都 是 

K ZW, AA XAF He X F IX 锁 对 表 的 部 分 或 全 部 锁定 。 

DB2 在 对 表 加 锁 时 ， 通 过 检查 表 上 是 否 已 经 加 了 意向 锁 ， 就 能 知道 表 中 是 否 有 一 部 

分 行 被 其 他 事务 锁 住 ， 而 不 需要 逐 行 查看 是 否 有 事务 对 这 张 表 加 了 锁 ， 这 自然 节省 了 时 

间 和 系统 资源 。 设想 一 下 ， 如 果 一 张 表 中 有 1000 万 行 记 录 , 那么 意向 锁 的 机 制 就 大 大 缩 

短 了 执行 时 间 。 

可 以 这 么 说 ， 意 向 锁 是 为 了 提高 数据 库 并 发 性 能 而 设计 的 。 
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KEM (S): 事务 为 了 读 取 整个 表 的 数据 而 加 S 表 锁 。 在 表 上 加 S 锁 后 ， 不 需要 再 在 
行 一 级 加 锁 。 如 果 一 个 事务 得 到 某 表 的 S 锁 ， 该 事务 可 以 读 表 中 的 任何 数据 ， 同 时 允许 
其 他 事务 获得 该 表 上 的 谈 锁 。 如 果 有 事务 需要 更 改 该 表 上 的 数据 ， 必 须 等 待 $ 锁 被 释放 。 
排他 锁 〈《X) : 事务 为 了 读 取 和 更 新 整个 表 而 加 X 表 锁 。 其 他 事务 不 能 更 改 表 中 数据 ， 
而 且 只 有 采用 未 提交 读 隔离 级 才 可 以 读 表 中 数据 。 如 果 在 表 上 加 了 XX 锁 ， 则 不 需要 再 
在 行 一 级 加 锁 。 

更 新 锁 〈U) : 该 锁 是 等 竺 对 表 进 行 更 改 的 一 种 中 间 状 态 。 事 务 加 U 表 锁 后 ， 可 以 读 
表 中 的 任何 数据 ， 并 最 终 可 以 通过 获得 表 上 的 X 锁 来 得 到 对 表 中 任何 数据 的 修改 权 。 
对 于 加 了 UU 锁 的 表 ， 其 他 事务 只 能 读 取 该 表 中 的 数据 。 值 得 一 提 的 是 ，U 锁 与 $ 锁 的 
区 别 主要 在 于 更 改 的 意图 上 。 有 了 U 锁 ， 可 以 减 小 死 锁 发 生 的 概率 。 人 例如， 如果 没 有 
U 锁 ， 当 两 个 事务 在 读 取 数据 时 ， 只 能 加 S 锁 ， 然 后 这 两 个 事务 又 都 要 对 数据 进行 更 
新 ， 这 样 两 个 事务 都 要 将 持 有 的 S 锁 转 换 为 X 锁 。 为 此 ， 每 个 事务 都 需要 等 待 对方 先 
释放 Sc AMRETA. AT U 锁 以 后 ， 上 述 两 个 事务 ， 在 一 开始 访问 数据 时 束 
申请 加 局 锁 而 不 是 S$S 锁 (如 果 是 Update 语句 ,DB2 会 自动 对 数据 加 癌 锁 ;如 果 是 SELECT 
语句 ， 用 户 可 以 通过 FOR UPDATE 子 句 指定 对 该 取 的 数据 加 TU 锁 ) 。 因 为 U 锁 之 间 
是 不 相 兼容 的 ， 其 中 一 个 事务 获得 U 锁 后 ， 另 一 个 事务 将 等 待 ， 这 样 就 避免 了 死 锁 。 
超级 排他 锁 〈Z) : 事务 一 般 在 对 表 进 行 删除 (Drop) 、 转 换 (Alter) 操作 ， 或 是 创建 、 
删除 索引 的 操作 时 而 加 乙 锁 。Z 锁 不 需要 行 锁 配 合 。 如 果 对 表 加 上 过 锁 ， 则 其 他 事务 ， 
包括 采用 未 提交 读 隔 离 级 的 程序 都 不 能 对 该 表 进 行 任 何 操作 。 


不 同 的 表 锁 具有 不 同 的 锁定 粒度 ， 大 家 可 以 从 它们 之 间 的 兼容 关系 体会 其 意义 和 用 途 。 如 
K 8-2 所 示 ， 其 中 表 锁 A 表示 已 加 的 一 个 表 锁 ， 表 锁 B 表示 符 加 的 表 锁 ，YES 或 NO 表示 二 者 
AE dX. Wü. IN BOR IN 锁 对 应 YES， 表 示 二 者 兼容 ， 即 表 上 已 经 和 被 加 了 IN 锁 的 情况 下 ， 
还 可 以 加 上 另 一 个 IN 8t. 


表 8-2 表 锁 的 兼容 关系 
Aalt (RHB) 


in z 


IN 
IS 
IX 
SIX 


No 
No 
No 
No 
No 
No 
No 
No 


从 表 8-2 还 可 以 看 出 ，Z 锁 是 最 严格 的 ， 加 Z 锁 意 味 痢 要 对 表 的 结构 进行 修改 ， 例 如 ， 执 
ÍT Drop table 操作 和 直接 删除 表 。 而 IN 锁 是 最 不 严格 的 表 锁 ,与 乙 锁 之 外 的 其 他 锁 都 兼容 ， 这 意 
味 看 只 要 表 结 构 不 发 生变 化 ， 就 可 以 加 锁 成 功 。 而 SEX 锁 的 兼容 性 等 同 于 S 锁 加 上 IX 8t. U 
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锁 的 作用 是 使 有 数据 更 改 意 癌 的 事务 互 斥 ， 同 时 保证 读 事 务 能 该 取 数据 。 
2. 行 锁 


如 末 只 在 表 级 别 上 加 上 严格 的 表 锁 ， 那 么 锁 的 粒度 束 会 过 大 ， 并 发 性 将 会 很 低 。 所 以 除 表 
锁 以 外 ，DB2 还 定义 了 行 锁 。 行 锁 和 表 锁 配合 使 用 的 方式 ， 比 单一 使 用 表 锁 更 加 灵活 ， 可 以 实 
现 更 佳 的 并 发 性 能 。DB2 中 的 行 锁 如 表 8-3 所 示 。 


表 8-3 TH 
ae TITTUET 
s " 
u x 
X 排他 锁 (eXclusive) IX 
NS i 
Nw Ix 


下 面 是 对 每 种 行 锁具 体 含 义 的 说 明 。 

(1) RFM CSO : 事务 为 了 读 取 数据 行 而 加 $ 行 锁 。 它 允许 其 他 事务 获得 该 行 上 的 读 锁 
(S, NS 或 U 锁 ) 。 如 果 其 他 事务 需要 更 改 该 行 ， 必 须 等 $ 锁 释 放 。 该 锁 需 要 与 表 锁 配合 ， 需 
要 的 最 低级 别 表 锁 是 IS 。 

(2) EJA U): 事务 加 U 行 锁 是 为 了 先 该 取 数 据 行 ， 然 后 通过 升级 到 X 锁 ， 更 改 该 
数据 行 。 和 表 上 的 U 锁 一 样 ， 该 锁 是 等 竺 对 数据 进行 更 改 的 一 种 中 间 状 态 。 其 他 事务 可 以 谈 数 
据 ， 但 不 可 以 更 狐 数 据 , 行 上 的 UU 锁 主 要 是 为 了 避免 两 个 事务 在 拥有 S 行 锁 的 情况 下 同时 申请 
X 行 锁 而 造成 死 锁 。 该 锁 需 要 的 最 低级 别 表 锁 是 X. 

(3) 排他 锁 (X) : 事务 为 了 修改 数据 行 而 加 X 行 锁 ， 其 他 事务 不 能 对 该 行进 行 读 或 者 更 
改 操 作 。 只 有 采用 未 提交 该 隔离 级 的 事务 才 可 以 访问 该 行 。 访 锁 需 要 的 最 低级 别 表 锁 是 IX。 

(4) FRERE (NS) : 事务 为 了 读 取 数据 行 而 加 此 锁 。 当 RS 和 CS 隔离 级 下 ( 见 8.2.1 
节 对 隔离 级 的 详细 介绍 ) 读 取 数据 行 时 ，NS BOATS SA (在 RR 隔离 级 下 ， 仍 加 S 锁 ) o ix 
锁 需 要 的 最 低级 别 的 表 锁 是 IS 。 

(5) 下 一 键 弱 排 他 锁 CNW) : 当 一 行 数 据 被 插入 到 建 有 索引 的 表 中 ， 该 行 在 索引 中 对 应 
的 下 一 行 会 被 加 上 该 锁 。 该 锁 与 X 锁 类 似 ， 只 是 与 NS SW. HO dEe E R| ITA HI EJ 
NW St. NW 行 锁 需要 的 最 低级 别 的 表 锁 是 IX。 

上 述 行 锁 之 间 的 兼容 关系 如 表 8-4 所 示 ， 其 中 行 锁 A 表示 已 加 的 一 个 行 锁 ， 行 锁 B 表示 行 
MAJTA, YES 或 NO Xon P ze 3k. VU, SAM $ 锁 对 应 YES. Xen AE 


X 8-4 行 锁 的 兼容 关系 
Pe AAIE GTH B) 
行 锁 A 
No 
No 


NW 
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行销 A 兼容 性 〈 行 锁 B) 
TF 


> 
Ns — Lws ws no — [ws —— 
sw  |vo lm — [wo — [ys 


从 表 8-4 可 以 看 出 ，X 锁 是 最 严格 的 ， 它 屏 殴 了 所 有 其 他 锁 。S 锁 是 最 种 用 的 锁 ， 上 只 和 读 


PRTEBU BC. U BUR S 锁 相 比 , RÆ REM f HR) U Bt. 用 于 有 更 改 意 图 的 操作 之 间 的 互 斥 ， 
但 不 阻 但 该 操作 。 


Ad 注意 : 9 意向 锁 是 如 何 和 行 名 
如 果 表 上 已 经 有 S、U、X 或 乙 这 样 的 表 锁 ， 这 些 表 锁 不 需要 和 行 锁 配合 。IS、IX、 
SIX 锁 用 于 表 级 生 dae Cun 阻止 其 他 事务 对 该 表 加 排他 人 锁 。 

e 如 果 一 个 事务 获得 某 表 的 IS 锁 ， 则 该 事务 可 以 获得 表 中 茶 行 的 S 锁 ， 用 于 读 取 
eg 

@ 如 果 一 个 事务 获得 某 表 的 I[X 锁 ， 则 该 事务 可 获得 菜 一 行 上 的 义 锁 ,用 于 更 改 操 
作 ， 同 时 其 他 事务 可 以 读 取 或 更 改 表 中 的 其 他 行 

e 如 果 一 个 事务 获 LARA SIX Hi, RE A-TLÉUE 某 一 行 上 的 X 锁 ， 用 于 更 
改 操作 ， 同 时 其 他 事务 只 能 对 表 中 其 他 行进 行 只 读 操作 。 


通过 学 习 锁 的 类 型 、 含 义 和 互 斥 关 系 ， 了 加 可 以 深入 理解 DB2 的 锁 机 制 ， 下 面 讲 述 DB2 的 


8.2 DB2 隔离 级 


当 事 务 执行 时 ，DB2 通过 控制 对 数据 对 象 加 锁 的 类 型 和 持 有 锁 的 时 间 ， 来 最 终 实 现 隔 离 级 
指定 的 事务 一 致 性 要 求 。 使 用 合理 的 隅 离 级 可 以 确保 数据 库 不 会 出 现 8.1.1 节 中 列 出 一 种 或 者 
多 种 不 一 致 现象 。 


8.2.1 DB2 提供 的 四 种 隔离 级 


DB2 一 共 文 持 四 种 隔离 级 ， 按 照 严 格 程度 ， 从 低 到 高 的 顺序 为 : 未 提交 读 (Uncommitted 
Read) WEER fa JE PE C Cursor Stability)、 读 稳定 性 (Read Stability) 和 可 重复 该 (Repeatable Read), 
隔离 级 越 低 ， 数 据 称 定性 越 甜 ， 但 是 并 发 性 越 好 。 
接 下 来 ， 将 结合 8.1.1 贡 中 用 到 的 例子 ， 有 具体 说 明 一 下 这 些 隔离 级 的 含义 。 


1. 未 提交 读 (CUR) 


最 不 严格 的 隔离 级 。 在 使 用 这 个 隔离 级 读 取 数 据 时 ， 会 对 表 加 IN 表 锁 ， 而 不 会 对 数据 行 


305 


DB2 设计 、 管 理 与 性 能 优化 艺术 


加 锁 。 当 然 在 事务 试图 修改 数据 时 ， 仍 然 需 要 获取 数据 行 上 的 X 锁 。 
使 用 这 种 隔离 级 ， 不 会 发 生 丢 失 更 新 ， 但 是 会 出 现 脏 谈 、 不 可 重复 读 和 幻影 读 现 象 。 
2. 游标 稳定 性 (CS) 


锁定 游标 定位 的 当前 行 ( 如 果 只 是 读 取 数据 ， 则 加 NS 锁 ;， 如 果 更 改 数 据 ， 则 加 和 EG d 
东 是 珊 有 更 改 意 问 的 读 取 ， 则 加 U 锁 〉。 对 该 行 的 锁定 将 持续 到 取出 下 一 行 记录 或 整个 事务 终 
止 时 为 止 。 

这 个 隅 离 级 解决 了 丢失 更 新 和 脏 读 的 问题 , 但 仍 存在 不 可 重复 该 和 约 影 恋 。 它 是 DB2 WIER 
认 陋 离 级 ， 能 够 保证 大 多 数 业 务 场 景 下 的 一 致 性 要 求 并 提供 最 好 的 并 发 性 。 


Aa 小 技巧 ，CS 隔离 级 在 DB2 V9.7 Hh 

在 DB2 V9.7 中 对 CS 隔离 级 进行 了 增强 ， 即 增加 了 当前 已 落实 机 制 ( 即 “Currently 
Committed”， 也 称 为 当前 已 提交 )。 

V9.7 之前， 在 CD 隔离 级 下 ， 一 个 读 事务 在 读 菜 行 数据 时 ， 如 果 该 数据 行 被 其 他 事 
务 修 履 了 ， 当 修改 它 的 事务 还 没有 完成 (提交 或 回 深 )， 这 个 读 事 务 就 必须 等 待 修改 事务 
的 完成 。 

如 果 启 用 了 当前 已 落实 ， 在 这 种 情况 下 ， 这 个 读 事务 将 不 会 等 待 修改 事务 的 完成 ， 
直接 读 此 行 修改 前 的 版 本 ( 即 当 前 时 刻 处 于 已 提交 状态 的 版 本 )。 这 样 大 大 增加 了 读 事务 
和 修改 事务 之 间 的 并 发 性 。 

在 DB2 V9.7 F, “当前 已 落实 ”在 缺 省 情况 下 是 打开 的 。 


3. 读 稳 定性 (RS) 


在 使 用 这 个 隔离 级 时 ， 上 只 是 锁定 事务 实际 检索 和 修改 的 行 《 上 只 是 读 取 数据 则 加 NS 锁 ; 修 
改 数据 加 和 X 锁 ; 有 修改 意 问 的 读 取 加 U 锁 ) ， 其 他 不 符合 检索 条 件 的 行 上 只 是 在 被 访问 的 时 候 被 
锁 住 ， 在 访问 下 一 行 时 会 被 释放 。 如 采 一 个 事务 访问 了 100 行 ， 但 符合 检索 条 件 的 只 有 10 行 ， 
那么 只 有 这 10 行 被 锁定 。 

RS 隔离 级 可 以 解决 丢失 更 新 、 脏 读 和 不 可 重复 读 的 问题 ， 但 仍 存 在 幻影 读 的 问题 。 

4. 可 重复 读 (RR) 


最 严格 的 隅 离 级 ， 可 以 防止 所 有 数据 不 一 致 现象 ， 即 不 出 现 脏 读 、 不 可 重复 读 、 约 影 读 和 
丢失 更 新 现象 ， 但 是 并 发 性 能 最 差 。 

RR 隔离 级 保证 在 一 个 事务 中 ， 当 两 次 执行 同一 个 SELECT 语句 时 ， 奏 询 的 结束 总 是 相同 
的 。 为 此 ，DB2 会 对 表 上 加 S 锁 ， 直 到 事务 结束 时 释放 锁 。 

在 8.1.1 节 的 例子 中 ， 如 末 使 用 了 RR 隅 离 级 ,在 操作 账户 信息 表 时 ， 束 不 用 担心 其 他 事务 
插入 新 的 账户 记录 或 更 新 已 恋 取 的 账户 信息 。 

X 8-5 是 隔离 级 和 事务 一 致 性 现象 的 关系 对 应 表 。 可 以 看 到 ， 丢 失 更 新 在 任何 一 种 隔离 级 
中 都 不 会 出 现 ， 脏 读 会 出 现在 未 提交 读 隔 离 级 中 ; 不 可 重复 读 会 出 现在 游标 稳定 性 和 未 提交 读 
隔离 级 中 ; 幻影 读 只 有 在 可 重复 读 隔 离 级 下 才 不 会 出 现 。 
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表 8-5 ”隔离 级 和 事务 一 致 性 
T awik 
可 重复 读 (RR) Tim 
WEE (RS) "m 
游标 站 定性 CS) m 
未 提交 读 CUR) m 


8.2.2 ”如 何 设 定 隔离 级 


DB2 提供 了 多 种 设 定 和 调整 隔离 级 的 手段 ， 隔 离 级 可 以 在 下 列 不 同 层 次 上 设 定 : 会 话 级 
(Session， 也 称 为 程序 级 ) ~ Æ (Connection) 和 语句 级 (Statement) 。 
A 注意 ， 在 不 同 层次 设 定 有 什么 不 同 ? 
根据 所 起 作用 的 范围 排序 ， 会 话 级 > 连接 级 > 语句 级 ， 但 是 越 排 在 前 面 ， 优 先 级 就 越 
低 。 也 就 是 说 , 会话 级 的 设置 会 被 连接 级 和 语句 级 埠 盖 ， 连接 级 的 设置 会 被 语句 级 堆 盖 ， 


1. 会 话 级 设置 


(1) 在 db2cli.ini 文件 中 使 用 TXNISOLATION 关键 字 指 定 隔离 级 , 可 以 改变 ODBC/JDBC 
程序 的 隔离 级 。 
(2) 对 于 静态 SQL 语句 ， 在 执行 PREP〈 预 编译 命令 ) 或 BIND (REMA) 进行 预 编 
译 或 绑 定 时 ， 可 以 使 用 ISOLATION 选项 指定 隔离 级 。 
(3) 在 ODBC/CLI 中 ， 使 用 CHANGE ISOLATION LEVEL 命令 改变 会 话 隔离 级 。 
2. 连接 级 设置 


(1) Æ ODBC/CLI 中 ， 利 用 SQLSetConnectAttr 函数 ， 通 过 配置 连接 句柄 的 SOL ATTR_ 
TXN ISOLATION 属性 ， 设 置 CLI 连接 的 隔离 级 。 该 属性 可 以 设置 为 如 下 的 值 : SQL TXN - 
READ UNCOMMITTED (未 提交 读 ) 、SQL TXN READ COMMITTED (相当 于 DB2 的 游标 稳定 
性 隔离 级 ) ~ SQL TXN REPEATABLE READ (相当 于 DB2 的 读 稳定 性 隔离 级 ) 或 SQL TXN_ 
SERIALIZABLE (相当 于 DB2 的 可 重复 读 隔 离 级 ) 。 例 如 ， 下 面 的 SQLSetConnectAttr 调用 把 连接 
句柄 hdbc 的 SOL ATTR TXN ISOLATION 设 定 为 SQL TXN READ UNCOMMITTED， 从 而 将 
hdbc 对 应 的 CLI 连接 的 隅 离 级 设置 为 未 提交 恋 : 

cli rc = SQLSetConnectAttr (hdbc, 

SQL ATTR TXN ISOLATION, 


(SOLPOINTER)SQL TXN READ UNCOMMITTED, 
SOL NTS); 


(2) 使 用 SET CURRENT ISOLATION 语句 对 会 话 中 发 出 的 动态 SQL 语句 设置 隔离 级 。 
一 旦 设置 CURRENT ISOLATION 专用 和 寄存器， 就 会 影响 会 话 中 任何 后 续 动 态 SQL 语句 的 隔 
离 级 。 此 隔离 级 将 一 直 有 效 直 到 会 话 结束 或 者 发 出 SET CURRENT ISOLATION RESET 语句 
He 
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3. 语句 级 设置 


(1) 在 ODBC/CLI 中 ， 利 用 SQLSetStmtAttr 函数 ， 通 过 配置 语句 句柄 的 SOL ATTR 
STMTTXN ISOLATION 属性， 设置 语句 的 隔离 级 。 

(2) 可 以 通过 WITH [UR | CS | RS | RR] 子 句 设 定语 句 的 隔离 级 。 例 如 ， 如 果 你 只 想 查 看 
一 下 表 TI 的 行 数 ， 且 不 要 求 结果 很 精确 ， 你 可 以 使 用 下 面 的 语句 。 这 个 语句 通过 设 定 最 宽松 
的 UR 隔离 级 ， 可 实现 最 好 的 性 能 。 


SELECT COUNT(*) FROM T1 WITH UR 


8.3 ”实战 案例 : 锁 问 题 分 析 和 解 ; 


在 本 书 第 1 章 讲 过 懒惰 系统 , 它 往 往 和 锁 问 题 有 关 。 一 方面 ,， 锁 问题 会 导致 应 用 程序 出 错 ; 
nIm, CEK Y SQL HAJATI, ie T RRID 

先 说 一 个 案例 的 具体 场景 : 某 银行 新 业务 系统 上 线 不 久 ， 业 务 部 门 束 报告 ， 在 业务 局 峰 时 
系统 变 得 很 乙 ， 许 多 用 户 请 求 都 无 法 及 时 啊 应 。 于 是 ， 运 维和 人 员 对 数据 库 进行 了 健康 检查 ， 从 
检查 结 东 中 没有 发 现 明 显 的 CPU 或 VO HW, 4H Ze PUT — 881 [n] i8 e 

那么 什么 是 锁 问 题 ? 如何 分 析 和 人 解决 这 些 锁 问题 ? 本 市 将 深入 讲述 。 


8.3.1 什么 是 锁 问 题 

在 DB2 中 ， 锁 问题 有 4 种 ， 分 别 是 锁 等 待 、 锁 超时 、 锁 升级 和 死 锁 。 所 有 这 些 锁 问题 都 会 
导致 对 资源 不 必要 的 锁定 ， 延 长 事务 的 执行 时 间 ， 从 而 产生 性 能 下 降 。 

1. 锁 等 


当 一 个 事务 试图 访问 数据 对 象 时 ， 一 般 需 要 对 数据 对 象 申 请 加 锁 。 在 申请 锁 时 ， 如 果 该 数 
据 库 对 象 已 经 被 其 他 事务 锁定 ， 并 且 所 加 的 锁 与 正在 申请 的 锁 不 兼容 ， 驶 会 发 生 锁 等 竺 。 此 时 
当前 事务 会 被 放 入 一 个 等 每 队列 ， 等 每 占用 该 锁 的 事务 提交 或 回 深 来 释放 锁 。 

锁 等 行 是 一 种 正常 的 现象 ,一般 情 况 下 不 是 问题 。 长 时 间 的 锁 等 每 或 者 过 多 的 锁 等 每 才 可 
能 导致 性 能 问题 。 当 出 现 锁 等 竺 时， 有 可 能 是 隅 离 级 过 于 严格 ， 导 致 事务 局 用 了 不 必要 的 锁 。 

2. 锁 超 时 


当 发 生 锁 等 竺 时 , 如 果 锁 住 对 象 的 事务 没有 提交 或 回 滚 , 那么 请 求 锁 的 事务 就 会 一 直 等 得 。 
为 了 防止 请 求 锁 的 事务 无 限期 等 待 ，DB2 提供 了 LOCKTIMEOUT 数据 库 参 数 。 如 果 该 参数 设 
置 为 0-32767 之 闻 的 值 〈 单 位 为 秒 ) ， 则 当 锁 等 待 的 时 间 超 过 这 个 参数 的 设 定 值 ， 就 会 返回 
SQLCODE= 一 911， 原 因 代 人 码 68， 并 回 深 事 务 ， 这 就 是 锁 超时 。 当 LOCKTIMEOUT 的 值 设 置 
为 一 1〈 这 也 是 缺 省 值 ) 时 ， 请 求 锁 的 事务 会 无 限期 等 符 。 

锁 超时 一 般 是 由 以 下 原因 造成 的 : 

(1) LOCKTIMEOUT 的 值 太 低 ; 

(20 某 个 事务 持 有 锁 的 时 间 过 长 。 
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3. 锁 升 级 


DB2 中 的 锁 本 质 上 是 内 存 里 面 的 数据 结构 ， 随 看 数据 库 中 对 象 上 的 锁 不 断 增加 ， 锁 所 占用 
的 总 内 存 也 会 不 断 增 加 。 为 了 防止 锁 占 用 的 内 存 无 限制 增加 , 在 所 占 空间 达到 一 定 上 限时 , DB2 
会 试图 把 儿 个 行 级 别 的 锁 合 并 为 一 个 表 级 别 的 锁 从 而 释放 锁 空 间 ， 这 就 是 锁 升 级 。 下 面 两 个 参 
数 决 定 了 锁 所 占 空间 的 上 限 : 

(1) LOCKLIST 参数 

规定 了 锁 列 表 所 能 够 占用 的 总 内 存 空间 ， 默 认 值 为 Automatic， 即 由 DB2 HJ US S 。 注 意 ， 
只 有 在 DB2 的 数据 库 参 数 SELF TUNING MEM 设 为 ON， 才 会 真正 进行 自动 调节 ， 对 于 下 面 
的 MAXLOCKS 参数 也 是 如 此 。 

(2) MAXLOCKS 参数 

规定 了 每 个 应 用 程序 所 能 拥有 的 锁 内 存 占 锁 列 表 的 最 大 百分比 ， 默 认 值 为 Automatic, BH 
由 DB2 目 动 调节 。 

当 DB2 锁 列 表 耗 尽 或 者 一 个 应 用 程序 所 拥有 的 锁 内 存 衬 间 大 于 LOCKLIST X 
(MAXLOCKS/100) 个 页 的 时 候 ， 束 会 发 生 锁 升级 。 

锁 升 级 一 般 来 说 是 不 正常 的 。 虽 然 锁 升级 本 号 并 不 耗费 多 少时 间 ， 但 是 锁 升 级 导致 更 多 的 
应 用 程序 阻塞， 大 大 降低 并 发 性 ， 造 成 数据 库 性 能 下 降 ， 还 会 间接 导致 其 他 的 锁 问题 ， 比 如 锁 
超时 。 所 以 ， 应 该 尽量 避免 锁 升 级 。 

4. 死 锁 


死 锁 丈 是 两 个 或 多 个 事务 为 获取 对 方 拥 有 的 资源 而 无 限期 相互 等 每 的 情况 。 出 现 无 限期 
等 每 ， 是 因为 相互 死 锁 的 事务 都 正好 持 有 对 方 想 要 的 资源 。 比 如 ， 事 务 A 获得 了 表 TI 上 的 
锁 ， 同 时 发 出 对 表 T2 的 锁 请 求 ， 而 事务 BEAK T2 上 的 锁 ， 却 同时 发 出 对 表 TI 的 锁 请 求 。 
XIE, 事务 A 要 等 待 事务 B 提交 并 释放 T2 上 的 锁 , 同时 事务 B 要 等 行事 务 A 提交 并 释放 TI 
上 的 锁 ， 双 方 陷入 了 循环 等 待 ， 从 而 产生 死 锁 。 


Zh 小 技巧 ， 通过 一 个 春晚 小 品 来 理解 死 名 
大 家 还 记得 央视 春晚 中 那 脸 炙 人 口 的 小 品 《 开 锁 》 吗 ? 黄 宏 把 所 有 的 证 件 都 存在 了 
一 个 箱子 里 面 ， 结 果 铀 是 丢 了 ， 请 来 了 开锁 公司 的 人 林 永 健 来 开锁 。 开 锁 公司 的 人 需要 
客户 出 示 有 效 证 件 才能 打开 箱子 ， 黄 宏 需 要 打开 箱子 才能 拿 到 和 出 示 有 效 证 件 ， 双 方 都 
持 有 对 方 想 要 的 资源 且 都 不 能 释放 ， 这 样 就 形成 了 一 个 逻辑 上 的 死 锁 。 


当 发 生死 锁 时 ,事务 可 能 会 无 限期 地 每 每 , 也 可 能 被 死 锁 监视 右 检 测 到 ,并 触发 事务 回 深 。 


8.3.2 ”从 监控 开始 


当 出 现 锁 问题 时 ， 首先 需要 从 监控 开始 。 打开 bankdb 数据 库 的 锁 信息 快照 开关 ， 收集 快 照 
信息 后 ， 发 现 系统 存在 严重 的 锁 等 每 、 锁 超时 、 锁 升级 和 死 锁 等 问题 : 


-» db2 update monitor switches using lock on  €41]JF C BBR JT 


三 饼 获 取 数 据 库 bankqb 上 的 快照 
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Database Snapshot 


Database name = BANKDB 

Locks held currently = 15 

Lock waits = 80 饼 锁 等 待 数 
Time database waited on locks (ms) = 3350383 所 锁 等 待 时 间 
Lock list memory in use (Bytes) = 54400 

Deadlocks detected = 11 所 检测 到 的 死 锁 数 
Lock escalations - 20 饼 锁 升级 数 
Exclusive lock escalations = 0 

Agents currently waiting on locks = 10 

Lock Timeouts = 134 € SUE T 
Number of indoubt transactions = 0 


通过 检查 系统 诊断 日 志 db2diag.log， 进 一 步 确认 了 锁 超 时 、 锁 升级 等 出 错 信 息 : 


2011=07=01=13.,35.,27.265057+460 139565468158619 LEVEL: Info 
EARD DES TID 8 A47467592673600BPROC : db2syse Q0 
INSTANCE; insti NODE : 000 DB : BANKDB 
APPHDL 3 0=32 APPIDs “NO useri. 110729055249 
AUTHID 8 USERI 

EDUID 9> 了 EDUNAME: db2agent (BANKDB) 0 


FUNCTION: DB2 UDB, oper system services, sqlofica, probe:10 
DATA #1 : SQLCA, PD DB2 TYPE SOLCA, 136 bytes 

Seueri eb : SOLCA Senece sqlcode: -911 sqlerrml: 2 
sqlerrmc: 68 

saglerro ODE 4 


sqlerrd : (1) 0x80100044 (2) 0x00000044 (3) 0x00000000 
(4) 0x00000000 (5) ORXEPEPPEPEOC (6) 0x00000000 
sqglwarn : (1) (2) [e (4) (5) (6) 
(1) (8) (9) (10) (11) 


sqlstate: 40001 


2011-07-07-14.18.13.834104 Instance:userl16 Node:000 DB: BANKDB 
PID: 691912 (cdlo2agent ) TID:1 Appice: “NO. Userl6,110729053249 


ADM5502W The escalation of "635" locks on table "ACCOUNTS_BALANCE" to lock intent "S" 
was successful 


o o o o 


201=U7=09=10 58.28.094844=300 工 37273015A836 ET 
PID 2 594116 TID 3 9661 BROC Go2SySsG (0 
NS Es el NODE : 000 DB : BANKDB 
GUEJE ND AEPIDSCSNOSWSGEILT 110802155747 
AUTHID 3 USERI14 

EDUID 3 9661 EDUNAME: db2agent (PROD) O0 


PUNCTION:s DB2 UDB, trace services, sqlt logerr darca (secondary logging tune 
DATA $1 : SQLCA, PD DB2 TYPE SQLCA, 136 bytes 

sqlcaid : SQLCA sa@leabes 136 sqlcode: -911 sqlerrml: 1 

sqlerrmc: 2 

sqlerrp : SQLRI2C4 

saglerre 3 (1) Vx80100002 (2) 0x00000002 (3) 0x00000000 
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(4) 0x00000000 (5) OXFFPFPEOG (6) 0x00000001 
wen (2) (>) (4) (>) (6) 

(7) (8) (9) (10) eu 
SEALSTATE 3 0 


应 用 程序 也 不 时 返回 一 911 错误 : 


SQLO911N The current transaction has been rolled back because of a deadlock 
dr timeoucE,. Reason code og SOLSTATE=40001 


谈 者 可 能 会 问 : 这 些 锁 等 每 、 锁 超时 和 锁 升级 是 否 合 理 ? MARERE? 是 应 用 程 
序 设计 的 问题 还 是 数据 库 相 关 参 数 配置 的 问题 ? 下 面 将 深入 探讨 分 析 与 解决 这 些 问 题 。 


8.3.3 ” 锁 等 每 分 析 和 人 解决 
在 上 一 节 的 案例 中 ， 发 现 系统 有 多 次 锁 等 待 。 通 过 下 面 的 步骤 ， 可 以 按部就班 的 对 锁 等 待 
A 
CIO 通过 db2pd 命令 查看 数据 库 bankdb 中 锁 等 竺 的 详细 情况 。 


=> db2pd -db bankdb -wlocks 
Database Member 0 ==- Database BANKDB == Active == Up 0 days 00:10:20 == Date 06/09/2011 


Locks being waited on : 


AppHandl TranHdl Type Mode Sts AppName AppID 
3511 14 RowLock ex G db2bp *LOCAL.user.110609204956 
3509 15 RowLock <U W db2bp *LOCAL user, 110609204832 


注意 上 和 面 的 输出 中 的 Sts 列 ， 它 表示 锁 的 状态 ，“G” 表 示 granted， 即 已 获得 的 锁 ; “W” 
表示 正在 等 待 的 锁 。 由 Sts 列 可 以 看 出 ,一 个 TranHdl 为 14 的 事务 (对 应 的 应 用 程序 句柄 为 3511) 
获得 了 该 对 象 的 锁 〈X 锁 ) ， 男 一 个 TranHdl 为 15 的 事务 〈 对 应 的 应 用 程序 句柄 为 3309) 则 
和 等 竺 对 该 对 象 加 锁 CU. 锁 ) 。 

(2) 通过 db2pd-apinfo 命令 可 以 看 到 两 个 事务 所 对 应 的 应 用 程序 《句柄 分 别 为 3511 和 
3509) 的 详细 信息 : 

应 用 程序 3511 的 详细 信息 ， 可 以 看 出 事务 14 处 于 等 待 完成 状态 : 


=> db2pd -apinfo 3511 -db bankdb 


Database Member 0 -- Database BANKDB -- Active -- Up 0 days 00:37:38 
apinfo Time: 07/09/2011 16:18:30 
Application s 
Address : 0x07800000048B0080 
AppHandl [nod-index] : 3511 [000-03511] EHEH 
der cum S 14 
Application PID 4 885140 
Application Node Name : maradona 
IP Address: n/a 
Connection Start Time : (135076032596) Thu Jun 9 15:49:56 2011 
Client User ID : user 
System Auth ID : USER 
Coordinator EDU ID : 9537 
Coordinator Member : 0 
Number of Agents : 1l 
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Locks timeout value : NotSet 

LOCkS Escalation s No 

Norako gD: 1 

Workload Occurrence ID : 4 

Trusted Context : n/a 

Connection Trust pec: non trusted 

Role Inherited : n/a 

eon on UOW-Waiting 万 该 应 用 程序 处 于 UOW-Waiting 即 等 待 事务 完成 状态 
Application Name : db2bp 

Application ID s * LOCAL user, 110609204956 


从 下 面 应 用 3509 的 详细 信息 ， 可 以 看 出 事务 15 正在 执行 将 账户 CACCOUNT ID 为 
“95533222” ) 的 余额 增加 3000 元 的 操作 ， 而 应 用 程序 的 状态 处 于 Lock-wait 也 就 是 锁 等 竺 状 
态 。 从 步骤 (1) 中 已 经 看 到 , 这 个 锁 等 每 是 由 于 事务 14 以 X 锁 锁 定 该 账户 ,导致 应 用 程序 3509 
中 的 事务 A 无 法 获得 U 锁 造 成 的 。 


=> db2pd -apinfo 3509 -db bankdb 


Database Member 0 -- Database BANKDB -- Active -- Up 0 days 00:48:40 
apinto Times 07/09/2011 16:29:32 
Application 
Address : 0x07800000048D0080 
AppHandl [nod-index] : 3509 [000-03509] €E HET AJIA 
Tranh 3 L5 
Application PID e 610424 
Application Node Name : maradona 
IP Address: n/a 
Connection Start Time s> (13076525312) Tu Jun 9 1554808332 2011 
Client User ID : user 
System Auth ID : user 
Coordinator EDU ID 3 9306 
Coordinator Member : 0 
Number of Agents : 1 
Locks timeout value : NotSet 
LoOEks Escalation =s No 
Worrall re 1 
Workload Occurrence ID : 5 
Trusted Conter : n/a 
Connection Trust Type : non trusted 
Role Inherited : n/a 
Application Status : Lock-wait 该 应 用 程序 处 于 Lock-wait 即 锁 等 待 状态 
Application Name : db2bp 
Application ID s *LOCAL .user.110609204832 


List of active statements 


DUON EDE: 1 
Activity ID s 1 
Package Schema : NULLID 
Package Name : SoM 


Package Version 
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Section Number : 203 

SOL Type : Dynamic 

Isolation s CS 

Statement Type : DML, Insert/Update/Delete 

Statement : update ACCOUNTS BALANCE SET 各 该 应 用 程序 正在 执行 的 SQL 语句 


BALANCE = BALANCE + 3000 WHERE ACCOUNT ID -'95533222' 


(3) 通过 db2pd -dynamic 查看 bankdb 上 执行 过 的 语句 ， 从 而 确认 事务 14 执行 过 什么 语句 。 
从 下 面 的 输出 中 ， 可 以 发 现 两 个 语句 : 一 个 是 前 面 看 到 事务 15 正在 执行 的 Update 语句 ; 23 
一 个 就 是 要 找 的 事务 14 执行 过 的 Update 语句 ， 正 是 这 个 语句 修改 了 账户 ， 锁 住 了 对 应 数据 行 。 


=> db2pd -db bankdb -dynamic 


Database Member 0 -- Database BANKDB -- Active -- Up 0 days 01:02:51 
Dynamic Cacnes 

Current Memory Used 1432076 

Total Heap Size 13699317 

Cache Overflow Flag 0 

Number of References 1547 


Number of Statement Inserts 507 
Number of Statement Deletes 473 
Number of Variation Inserts 86 
Number of Statements 34 


Dynamic SQL Statements: 
Address ore hop S m 0 D NumEnv NumVar NumRe f NumExe Text 
0x070000003757FD00 6 1 ii ii ili iji 


update ACCOUNTS BALANCE SET BALANCE = BALANCE + 900 WHERE ACCOUNT ID ='95533222' 
€xjEÉ3ó 14 已 经 执行 过 的 update 语句 


0x0700000053546DD00 7 1 1 1 1 1 


update ACCOUNTS BALANCE SET BALANCE = BALANCE + 3000 WHERE ACCOUNT ID ='95533222' 
饼 这 是 事务 15 正在 执行 的 Update 语句 


(4) 最 后 可 以 确定 ， 两 个 事务 同时 转账 到 相同 账户 。 事 务 14 先 将 900 元 打 入 ID 为 95533222 
的 账户 ， 数 据 库 会 执行 一 个 Update 语句 ， 更 新 此 账户 的 余额 。 正 如 上 面 通过 db2pd-dyn 命令 看 
到 的 ， 执 行 的 Update 语句 如 下 : 


Update c ount- balan Eo lancek balanc a T 900er eune 9 ， 95533222 


这 个 时 候 ， 事 务 14 还 没有 提交 ， 事 务 15 要 问 同 一 账户 打 入 3000 元 。 它 执行 了 下 列 语句 : 


update ki ount Palane ee e oaae lm a Oae eae a a OOo 220 


G 注意 : 事务 14 为 什么 长 时 间 持 有 锁 ， 
事务 14 更 新 账户 余额 时 ， 在 CS 隔离 级 下 ， 数 据 库 对 被 修改 的 账户 加 了 X 锁 ， 而 且 
这 个 锁 会 保持 到 事务 结束 。 事 务 15 在 读 到 该 账户 时 ， 要 加 U 锁 ， 但 因为 U 锁 和 X 锁 不 兼 
容 ， 所 以 要 等 待 事务 14 完成 并 释放 锁 。 但 是 事务 14 由 于 应 用 程序 的 问题 ， 需 要 较 长 时 间 
才能 执行 完毕 ， 这 个 时 间 段 它 所 持 有 的 锁 不 会 释放 ， 这 样 事务 15 只 能 处 于 锁 等 待 状态 。 
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从 上 面 的 分 析 中 可 以 看 到 ， 在 CS 隔离 级 下 ， 当 一 个 事务 在 修改 茶 一 条 记录 ， 忆 一 个 事务 
试图 修改 同一 条 记录 时 会 被 阻塞 。 那 么 ， 帮 一 个 事务 读 取 该 记录 是 否 会 被 阻 豆 呢 ? 

由 于 DB2 在 V9.7 中 引入 了 “当前 已 落实 ”功能 ， 只 恋 的 操作 过 到 被 其 他 事务 修改 而 未 提 
区 的 记录 时 ， 会 读 取 该 记录 修改 前 的 版 本 ， 所 以 不 会 被 阻 禾 。 

8.3.4 锁 超 时 分 析 和 解 

在 这 个 案例 中 ， 根 据 快 照 信息 发 现 数 据 库 发 生 了 多 次 锁 超 时 ， 相 关 信 息 如 下 : 


=> db2 get snapshot for database on bankdb 


Database Snapshot 
Database name — BANKDB 
Lock Timeouts = 134 所 锁 超 时 数 


查看 数据 库 bankdb 的 LOCKTIMEOUT 参数 ， 发 现 设置 为 30 秒 。 


=> db2 get db cfg |grep LOCKTIMEOUT 
Lock timeout (sec) (LOCKTIMEOUT) = 30 


那么 如 何 监控 和 分 析 这 种 锁 超 时 事件 呢 ? HEE H A A AER I e a INE SEE, R 
如 下 : 
(1) 使 用 CREATE EVENT MONITOR FOR LOCKING 语句 创建 名 为 mon timeout 的 锁 事 
fF Us TS: 


CREATE EVENT MONITOR mon timeout FOR LOCKING WRITE TO UNFORMATTED EVENT TABLE 


(2) 为 了 让 DB2 收集 详细 的 锁 信 息 , 需要 更 改 MON LOCKTIMEOUT,. MON DEADLOCK, 
MON LOCKWAIT fll MON LW THRESH 数据 库 参 数 。 
将 前 三 个 参数 都 设 为 HIST AND VALUES， 这 样 能 够 收集 尽量 多 的 信息 。 同 时 ， 
MON LW THRESH 被 设 为 10 秒 (下面 命 令 中 的 数字 10000000 的 单位 是 微 秒 ) 。 


db2 update db cfg using MON LOCKTIMEOUT HIST AND VALUES MON DEADLOCK HIST AND VALUES 
MON LOCKWAIT HIST AND VALUES MON LW THRESH 10000000 


(3) 激活 锁 事 件 监视 器 mon timeout。 锁 事件 监视 器 创建 成 功 后 处 于 关闭 状态 ， 可 以 用 下 
面 的 语句 将 监视 右 的 状态 设置 为 1 来 开局 监视 右 。 


Set event monitor mon timeout state 1 


(4) SREDE, HOS SL CBE T3853 /N mon timeout 表 中 。 可 以 调用 
存储 过 程 EVMON FORMAT UE TO TABLES 将 锁 超 时 信息 从 表 mon timeout 中 取出 ,进行 
格式 化 后 存 入 创建 的 新 表 中 : 


call EVMON FORMAT UE TO TABLES ('LOCKING', NULL, NULL, NULL, NULL, NULL, 
'RECREATE FORCE', -1, 'SELECT * FROM mon timeout ORDER BY event timestamp') 


调用 成 功 后 ， 会 在 当前 模式 下 创建 下 列 $ 张 新 表 : LOCKWAITEVM, LOCK ACTIVITY - 
VALUES, LOCK EVENT, LOCK PARTICIPANTS 和 LOCK PARTICIPANT ACTIVITIES, 
格式 化 后 的 锁 超 时 信息 就 存放 在 这 些 表 中 。 
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(5) 通过 下 面 的 语句 可 以 得 到 锁 超时 对 应 的 应 用 程序 信息 : 


# 得 询 发 生 的 锁 事 件 的 XML_ID 名 ， 其 中 有 锁 事件 的 类 型 和 时 间 等 信息 
select substr(XMLID,1,64) xml id from LOCK EVENT 


db2LockEvent 2 LOCKWAIT 2011-05-18-17.34.09.293236 0 
db2LockEvent 3 LOCKTIMEOUT 2011-05-18-17.34.34.243606 0 


# 碍 询 参与 锁 超 时 的 应 用 程序 

select PARTICIPANT NO as p no, PARTICIPANT TYPE @s P CYPE, 
PARTICIPANT NO HOLDING LK @s p no holaling Lk, APPLICATION HANDLE ag 
appl hanle, substr(TABLE NAME,1,10) as t name from LOCK PARTICIPANTS 


P NO P TYPE P NO HOLDLING LK APPL HANLE T name 
1 Requester 2 35%! ACCOUNTS_BALANCE 
2 Owner = 3509 = 


可 以 看 到 , 句柄 为 3511 的 应 用 程序 在 请 求 句 柄 为 3509 的 应 用 程序 的 锁 , 通过 下 面 的 db2pd 
命令 可 以 分 别 查 看 这 两 个 应 用 程序 的 情况 : 


db2pd -apinfo 3511 -db bankdb 
db2pd -apinfo 3509 -db bankdb 


(6) 得 看 和 锁 相 关 的 语句 : 


SELECT PARTICLPANT NO;, ACTIVITY TYPE, substr (STMT TEXT, 1,256) sgl text FROM 
LOCK PARTICIPANT ACTIVITIES 


得 到 和 锁 相 关 的 语句 后 ， 导 人 致 锁 超 时 的 原因 束 找 到 了 : 两 个 应 用 程序 在 各 上 自 的 事务 中 更 新 
了 同一 个 账户 ， 而 且 第 一 个 应 用 程序 的 事务 用 下 面 的 语句 先 对 ID 为 “95533222” 的 账户 进行 
了 更 新 操作 ， 在 事务 提交 前 ， 一 直 持 有 账户 上 的 X 锁 。 


update ACCOUNTS BALANCE SET BALANCE = BALANCE * 3000 WHERE ACCOUNT ID -'95533222' 


然后 第 二 个 应 用 程序 的 事务 进行 同样 的 Update 更 新 操作 。 第 二 个 事务 因为 请 求 加 U 锁 而 
要 等 待 第 一 个 事务 的 X 锁 释 放 ， 进 而 陷入 锁 等 待 。 

由 于 锁 超 时 LOCKTIMEOUT 设置 为 30 秒 ， 所 以 30 秒 后 ， 触 发 了 锁 超 时 ， 事 务 被 回 滚 ， 
得 到 SQL0911N 错误 消息 。 

人 至此， 完成 了 对 锁 超 时 事件 的 分 析 。 对 于 这 个 锁 超 时 ， 可 以 通过 尽快 提交 持 有 锁 的 事务 ， 
或 者 增加 锁 超时 参数 LOCKTIMEOUT 来 解决 。 


8.3.5 MARN ETARE 


DB2 有 一 个 很 特别 的 锁 问 题 ， 即 锁 升 级 ， 可 以 从 快照 信息 中 发 现 : 


=> db2 get snapshot for database on bankdb 
Database Snapshot 
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Database name = BANKDB 
Lock escalations = 20 包 锁 升级 数 


那么 访 如 何 分 析 锁 升级 呢 ? 

首先 ， 通 过 获取 数据 库 或 者 应 用 程序 的 快照 ， 可 以 得 到 锁 升 级 发 生 的 次 数 。 

其 次 ,通过 DB2 诊断 日 志 Cdb2diag.log) 能 够 确定 在 哪些 表 上 人 发生 了 锁 升 级 。 在 这 个 案例 
中 ，db2diag.log 文件 里 面 束 出 现 了 下 列 警 告 信 息 。 可 以 看 到 ， 表 USER.ACCOUNT 中 的 635 个 
行 锁 被 升级 成 了 表 上 的 S 锁 。 

Zug A name se TN S 000 

BID: 61912 (dobo2agent (BROD)) TID:1 Appicd * LOCAL. USe@r.050207191812 

data management sqldEscalateLocks Probe:2 Database:BANKDB 


ADM5500W DB2 is performing lock escalation. The total number of locks 
currently held is "864", and the target number of locks to hold is "432". 


209]0 06520 7-14] 9 13 594 T1042 Instance:user Nodes 000 

IE E pou oM (cdo2agent (PROD)) TID:1 Appicd: * LOCAL. user,.050207191812 

data management sqldEscalateLocks Probe:3 Database :BANKDB 

ADM5502W The escalation of "635" locks on table "USER.ACCOUNT" to lock 


intent "S" was successful 


最 后 , 通过 增 大 LOCKLIST 和 MAXLOCKS 的 值 以 减少 或 者 避免 锁 升 级 。 还 可 以 将 它们 都 
设 为 AUTOMATIC， 即 由 DB2 目 动 根据 需要 管理 锁 空 间 。 男 外 ， 从 应 用 程序 的 角度 来 看 ， 通 
过 增加 提交 次 数 或 者 降低 隔离 级 ， 也 能 够 减少 锁 升 级 发 生 的 次 数 。 


8.3.6 ”和 死 锁 分 析 和 解 ; 
在 这 个 案例 中 ， 从 快照 信息 中 可 以 看 出 ， 发 生 了 11 次 死 锁 ， 相 关 信息 如 下 : 


=> db2 get snapshot for database on bankdb 


Database Snapshot 
Database name = BANKDB 
Deadlocks detected = 11 «€ 3 A P AE B 


发 现 了 死 锁 ， 访 如何 解决 呢 ? 

第 一 种 办 法 ， 如 果 死 锁 可 以 用 固定 的 步骤 重 现 ， 那 么 可 以 通过 重 现 死 锁 ， 并 运用 分 析 锁 等 
符 的 方法 ,确定 哪 些 事务 导致 了 和 死 锁 ， 最 后 通过 调整 事务 的 隔离 级 或 者 修改 相应 的 SQL 语句 执 
行 顺序 来 解决 。 

男 外 一 种 办 法 是 ， 使 用 死 锁 事件 监视 器 ， 在 死 锁 发 生 时 收集 并 你 存 相 关 的 信息 ， 下 和 面 使 用 
这 种 方法 分 析 一 下 这 个 案例 的 死 锁 问题 。 为 叙述 方便 ， 我 们 对 肥 例 中 实际 的 事务 语句 、 表 名 以 
Jae ST CY fni. 

(1) BJEFF FIED AS deadlockmon. 

创建 和 打开 死 锁 事件 监视 右 的 命令 如 下 , 其 中 , deadlockmon 是 事件 监视 器 的 名 字 ; write to 
file 选项 指定 了 存放 收集 的 信息 的 文件 路 径 ， 即 中 ome/user/event; autostart 选项 指定 此 监视 器 在 
数据 库 局 动 时 目 动 打开 。 
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-- 创 建 死 锁 监 视 器 deadlockmon 
Crearte event monitor ë cleacdilockmonmn ror cdeacillocks wirirta details wrirce to file 


"/home/user/event" autostart 


-- 将 死 锁 监视 器 激活 

set event monitor deadlockmon state 1 

(2) AEEA IT ds. DB2 每 隔 一 定时 间 (由 数据 库 参 数 DLCHKTIME 定义 ) 会 自动 
检测 系统 中 是 否 有 死 锁 事 件 发 生 。 

当 发 现 死 锁 时 ，DB2 会 选取 参与 死 锁 事件 的 某 个 事务 进行 回 深 ， 直 到 死 锁 解除 。 在 死 锁 被 
解除 的 同时 ， 和 死 锁 相 关 的 信息 也 被 保存 下 来 了 。 被 回 滚 的 事务 将 收 到 下 面 的 出 错 信 息 : 


DB21034E The command was processed as an SQL statement because it was not a 
valid Command hane Processor command. During SQL processing it returned: 
SOLOO911N The current transaction has been rolled back because of a deadlock 
or timeout. Reason code "2". SQLSTATE-40001 


(350 发 生死 锁 后 ， 使 用 下 列 命 令 得 到 死 锁 监视 器 收集 的 信息 。 
通过 flush event monitor 命令 将 收集 的 信息 写 回 磁盘 ， 随 后 使 用 db2evmon 命令 格式 化 收集 
到 的 信息 ， 并 写 入 文件 mydldata.txt 中 。 


-- 将 deadlockmon 收集 的 信息 写 回 磁盘 


flush event monitor deadlockmon 


--XH] deadlockmon 


set event monitor deadlockmon state © 


-- 输 出 并 格式 化 监控 信息 到 文件 mydldata.txt 中 (在 /home/user/event 下 执行 ) 
db2evmon -db bankdb -evm deadlockmon >mydldata.txt 
(4) 打开 mydldata.txt， 可 以 看 到 利用 死 锁 监视 右 收 集 的 信息 ， 从 中 可 以 看 出 参与 死 锁 的 
所 有 事务 。 死 锁 信 息 中 出 现 的 事务 执行 了 语句 “update table2 set b = 100 wherea=2”， 通 过 对 
比 应 用 程序 名 、 用 户 信 息 等 ,我 们 发 现 它 来 自 于 运行 在 bankdb 上 的 一 个 应 用 程序 ， 在 这 里 称 之 
为 应 用 程序 A: 


Deadlocked Connection 
Deadlock ID: 3 
Participant no.3 2 
Participant no, holding che Locks 1 
Appl Ed: “LOCAL. user, 1107035200820 
Appl Seq number: 00006 
Tomon Client Applnames CLE test Joinz 
Appl ld of connection holding the Lock: “LOCAL. user,.110703200705 
Seq. no. of connection holding the lock: 00001 
Lock wait start times 07/03/2011 16:25337.722982 


Lock Name : 0x00000000000000000000000000 
Lock Attributes : 0x00000000 

Release Flags 2. 0200000000 

Lock Count 3 0 

Hole Count 3 0 


Deacilock cdetection time: 07/03/2011 16:25:52.523712 
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Table of lock waited on TABLE2 
Schema of lock waited on USER 

Data partition id for table x 0 
Tablespace of lock waited on USERSPACEI 


cr ec ku EON 
OE Noe S X 


application requested on lock: X 


Type 
Mode 
Mode 
Node 


= Exclusive 

= BxCluüusiyve 
lock occured) oms O 

Lock object name: 5 

Application Handle: 670 

Deadlocked Statement: 


Type Dynamic 

Operation: Execute Immediate 
Section 203 

Creator NULLID 

Package SOMme2y 

CUESOLE 


Cursor was blockings FALSE 
Text update table2 set b = 100 where a = 2 
LIST OE LOCKSS 


Lock Name 0x000000020000000100011FA0D6 


Lock AtCTCTELOUTES 0x00000000 
Release Flags 0x40000000 
LOCK Count EL 

Hold Count O 

Lock Object Name : 4 

Object Type ROW 
Tablespace Name USERSPACEI 
Table Schema USER 

Table Name TABLEI 

Data particion ial :0 


Mode 2 X - Exclusive 


下 面 的 死 锁 事 务 执行 了 语句 “update tablel set b = 200 wherea=1”， 这 里 将 执行 这 个 事务 
的 应 用 程序 称 为 应 用 程序 B: 


Deadlocked Connection 
Deadlock ID: 3 
Participant no.s 1 
Participant no., holding the Locks 2 
Appl Ic: “LOCAL. user. 110703200705 
Appl Seq number: 00003 
Appl rc of connection nolding the Locks 


SEG NOL 


* LOCAL. user. 110703200820 
Of connection holcing the locks 00001 
LOCk wair start time: 07/03/2011 16:25:46.247390 


Lock Name 0x00000000000000000000000000 


Eoock APPSTOuUbtes 0x00000000 

Release Flags 0x00000000 

Lock Count 23D 

Hold Count O 

Deadlock detection times 07/03/2011 16:25;52,.525562 
Table of lock waited on TABLE1 

Schema of lock waited on USER 
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Data partition icd for table 3 (0 

Tablespace of lock waited on 3 USERSPACEI 

Type of lock: Row 

Mode of lock: X -cExeCluswve 

Mode application requested on lock: X - Exclusive 
Node lock occured on: 0 

Lock object name: 4 

Application Handles 658 

Deadlocked Statement: 


Type 2 Dynamic 

Operation: Execute Immediate 
Section : 203 

Creator 3 NULLID 

Package : SQLC2U22 

Cursor 


Cursor was blockings FALSE 


Text : Update tablel set b = 200 where a = 1 
LISTET OE LOCKS43 
Lock Name : 0x000000020000000100010BA0D6 
Lock Attributes 2 0x00000000 
Release Flags : 0x40000000 


LAG c out: 
Hole Count 


Lock Object Name :0 

Object Type : Internal - Variation 

Data partition ic 3 =1 

Mode ES - Share 

Lock Name : 0x00020104000000000000000552 
Lock Attributes 2 0x00000000 

Release Flags : 0x40000000 


Doch cout 
Hole! Count 


Lock Object Name ED 

Object Type : Row 
Tablespace Name 2 USERSPACE 
Table Schema 2 USER 

Table Name 2 TABLEZ 

Data particion iad 5 0 

Mode PS = Bxelusive 


仔细 答 看 应 用 程序 A 和 B 中 的 语句 ， 发 现 它 们 首先 分 别 更 新 了 表 tablel 和 表 table2, HF 
A EDITH X Bi: 


-- 应 用 程序 A 
update tablel set b = 5 where a = 1 


-- 应 用 程序 B 
update table2 set b = 4 where a = 2 


然后 应 用 程序 A 更 新 表 table2， 应 用 程序 B 更 新 表 tablel: 


-- 应 用 程序 A 
update table2 set b = 100 where a = 2 
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-- 应 用 程序 B 
update tablel set b = 200 where a = 1 


如 图 8-5 所 示 ， 应 用 程序 A 和 B 要 更 新 两 张 表 里 面相 同 的 行 。 应 用 程序 A 先 更 新 了 表 
Tablel 的 行 Row1， 然 后 试 着 更 新 表 Table2 的 行 Row2。 而 应 用 程序 B 采用 相反 的 顺序 ， 先 更 
新 了 Table2 的 Row2， 继 而 试 独 更 新 Tablel 的 Rowl. 


Table 1 
ARAFA : | 应 后 征订 B 
更 新 Table1 的 行 Row | L | 更 新 Table1 的 行 Row2 
更 新 Table2 的 行 Row2 Ja. vi Row 1 X Eyi Table2 873: Row! 
Bow 2 
Table 2 
Row 1 
X Bow 2 v | 


图 8-5 RAP amm 


fr CS 隔离 级 下 ， 此 时 应 用 程序 A 持 有 Tablel 中 Rowl 上 的 X 锁 ， 而 试 着 申请 Table2 中 
Row2 上 的 TU 锁 ; 应 用 程序 B 持 有 Table2 中 Row2 上 的 X 锁 ， 而 试 着 请 求 Tablel 中 Rowl 上 
mn U 锁 。 

HT OU SUR X 锁 不 兼容 ，A 将 处 于 等 待 B 释放 Row2 上 的 X 锁 的 状态 ， 同 时 B 将 处 于 等 
待 A 释放 Rowl 上 的 X 锁 的 状态 。 这 样 ， 两 个 程序 陷入 死 锁 状 态 。 

这 个 死 锁 实际 上 是 由 于 两 个 事务 执行 操作 的 顺序 有 问题 造成 的 。 通 过 改变 应 用 程序 A 或 也 
中 两 个 更 新 操作 的 顺序 ， 让 它们 都 按照 先 更 新 表 Tablel 再 更 新 表 Table2 (或 者 相反 ) 的 顺序 进 
行 ， 就 可 以 避免 死 锁 。 


80.4 RANiXuU — DB2 日 志 的 秘 客 


众所周知 ,为 保证 数据 的 正确 性 ， 数据 库 的 事务 都 应 该 满足 ACID 原则 : 即 原子 性 (Atomic) 、 
一 致 性 〈Consistency) 、 完 整 性 (Integrity〉 和 持久 性 (Duration ) 。 无 论 是 Oracle 数据 库 ， 还 
是 DB2 数据 库 ， 数 据 库 日 志 机 制 是 你 证 ACID 原则 的 核心 。 


8.4.1 DB2 日 志 的 原理 


DB2 采用 的 是 一 种 预 写 式 日 志 CWrite-Ahead Logging) 方法 来 实现 事务 处 理 ， 简 称 WAL. 
预 写 式 日 志 的 中 心思 想 是 : 在 数据 库 中 更 独 、 插 入 或 删除 的 数据 ， 被 写 入 到 磁盘 之 前 ， 记 录 这 
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些 变化 的 日 六 必须 已 经 永久 写 入 到 磁盘 。 

首先 分 析 一 下 网 8-6， 预 写 式 日 忘 操作 有 个 先后 顺序 ， 就 是 在 数据 缓冲 区 中 即将 被 修改 的 
数据 ， 在 被 写 入 到 数据 磁盘 之 前 ， 修 改 前 的 数据 状态 与 修改 后 的 数据 状态 部 要 和 完 被 写 入 到 日 志 
缓冲 区 ， 之 后 还 要 永久 写 入 到 日 志文 件 中 。 这 些 操作 完成 后 ， 才 可 以 把 修改 后 的 数据 写 入 数据 


磁盘 中 。 这 其 中 , 控制 把 日 记 缓 冲 区 中 的 日 忘记 录 写 入 日 志文 件 的 程序 是 写 入 程序 (db2loggw)。 
数据 缓 神 区 日 志 组 神 区 


写 入 条 件 
e BAI (commit) 
e BIÍRERGA 15 


" AX 
数据 磁盘 ` Lo 四 达到 CHNGPGS_THRESH 
nder 


图 8-6 DB2 采用 的 预 写 式 日 志 


男 外 , 与 数据 库 绥 冲 区 关联 的 绥 冲 池 预 取 程 序 (db2pfchr) 和 绥 冲 区 页 清除 程序 Cdb2pclnr ) 
分 别 回 缓冲 区 中 读 入 数据 和 同人 磁 可 中 写 入 数据 。 
预 写 式 日 志 的 规则 是 日 志 为 先 ， 数 据 在 后 。 下 和 面 讨论 一 下 这 二 者 之 间 的 关系 。 
对 DB2 HERH, 每 一 条 日 志 记 录 首 先 会 写 入 到 日 志 缓冲 区 , 再 从 日 志 缓 冲 区 写 入 到 磁盘 。 
那么 在 什么 条 件 下 DB2 会 将 日 志 绥 冲 区 中 的 日 志 写 入 到 磁盘 呢 ? 
e 当前 事务 被 落实 (Commit) 时 ， 此 事务 的 日 志 必 须 由 日 志 缕 冲 区 写 入 到 磁盘 。 
e 为 了 最 小 化 数据 丢失， 每 隔 1 秒 ，DB2 会 将 日 志 绥 冲 区 的 日 志 写 入 到 磁盘 。 
e 在 特殊 情况 下 ， 当 日 志 绥 冲 区 满 了 ， 绥 冲 区 中 的 日 忘 会 被 江 即 写 入 到 磁 副 。 
e 当 数 据 绥 冲 区 满 时 ， 如 果 置 换 出 来 的 脏 数据 页 需要 写 回 人 磁盘， 则 在 此 之 前 ， 这 些 修改 
数据 对 应 的 日 志 记 录 必 须 先 写 回 磁盘 。 
对 于 DB2 数据 缓冲 区 中 的 数据 ， 数 据 缓冲 区 的 数据 写 入 到 磁盘 (也 称 为 数据 持久 化 ) 的 次 
数 要 远 远 小 于 日 志 缕 冲 区 的 写 入 次 数 。 那么 在 什么 条 件 下 DB2 会 将 数据 绥 冲 区 中 的 数据 写 入 到 
RiR We ? 
e "4 SOFTMAX 值 达到 限定 值 时 ， 数 据 绥 冲 区 中 的 数据 会 被 写 入 到 磁盘 中 。SOFTMAX fH 
是 一 个 数据 库 配 置 参 数 ， 它 决定 了 发 生 灾 难 恢复 时 所 需要 读 取 的 日 志文 件 的 数目 同时 
也 决定 了 数据 缓冲 区 同 磁 盘 写 入 数据 的 频率 。 
e 影响 数据 写 入 磁盘 频率 的 另 一 个 参数 是 CHNGPGS THRESH， 它 标志 着 数据 缓冲 区 中 
的 被 改变 数据 页 的 百分比 ， 一 般 为 60%。 即 当 数 据 缓冲 区 中 的 数据 页 有 60% 以 上 被 修 
改 时 ， 数 据 缓冲 区 会 执行 一 次 把 数据 写 入 磁盘 的 操作 。 
e 特殊 情况 下 ， 当 数据 缓冲 区 满 时 ， 与 日 志 缓 冲 区 一 样 ， 数 据 缓冲 区 会 立即 执行 把 数据 
写 入 磁盘 的 操作 。 
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SOFTMAX 参数 决定 了 DB2 在 灾难 恢复 时 需要 读 取 日 志文 件 的 数目 , 同时 它 也 决定 
了 数据 缓冲 区 向 磁盘 写 入 数据 的 频率 。 当 把 SOFTMAX 值 设 置 较 小 时 ， 当 发 生 灾 难 恢复 
时 的 恢复 速度 会 变 快 ， 但 是 数据 缓冲 区 写 数据 的 频率 会 变 高 ， 即 IO 次 数 会 变 大 。 反 之 ， 
如 果 采 用 较 大 的 SOFTMAX 值 ， 则 数据 库 UO 频率 会 降低 ， 但 是 一 旦 发 生 灾难 恢复 时 ， 
DB2 进行 恢复 的 时 间 会 延长 。 一 般 情 况 下 ， 设 置 SOFTMAX 值 区 间 为 100~300。 


那么 DB2 的 日 志文 件 到 的 什 么 样 呢 ? 先 看 看 日 志文 件 的 真面目 吧 。 


[dob2insti@ldb2? el get do ctg for SAMPLE | grep “Parth tco log files™ 
Path to log files = /db2/db21de/data sampl/db21de/NODE0000/SQL00001/SQLOGDIR/ 


[db2instlG8db2 | cd /db2/db21de/data sampl/db2l1de/NODE0000/S8QL00001/SQLOGDIR/ 


[clo ges c2 ESSE 
total 2.6G 


=w= @io2 Lae cioldeacm 512 2009-05-27 18352 SOLLPATH -7 TAG 
JOWE db21de dbldeadm 64M 2011-11-05 00:00 S0004717.L0G 
EW @io2 Lae cloldeacm 64M roe 
EW 二 二 二 二 二 于 El52 Lae cioldeacm 64M re 
EW ee db21lde dbldeadm 64M 2011-11-05 00:00 50004714.LOG 
=w cio2 Lae cioldeacm 64M 2011-11-05 00:00 50004713 -LOG 
= EW db21lde dbldeadm 64M 2011-11-05 00:00 50004712.LOG 
EW = Gl52 Lae cioldeacm 64M re 
mu Wee Qb2lae dbldeadm 64M 2011-11-05 00:00 50004710.LOG 
=w db21lde dbldeadm 64M 2011-11-05 00:00 50004709.LOG 
=rw db21lde dbldeadm 64M 2011-11-05 00:00 50004708 .LOG 
—Euy-eeee—R 1 œib2Llae cioldeacm 64M 2011-11-05 00:00 50004707 -LOG 
EW 1 db21lde dbldeadm 64M 2011-11-05 00:00 S0004706.LOG 


参照 上 面 的 示例 ， 读 者 需要 了 解 的 是 : 
e DB2 日 恋 是 以 文件 形式 存储 在 存储 介质 的 ， 如 日 记 中 的 S0004717.LOG 文件 。 
e DB2 日 志文 件 的 名 字 是 以 Sxxxxxxx.LOG 形式 存在 ， 其 中 xxxxxxx 为 7 位 数字 ， 从 
0000000 到 9999999， 即 日 志 可 从 S0000000.LOG 排 到 S9999999.LOG. 
e 每 一 个 日 志文 件 的 大 小 一 致 ， 如 示例 中 的 大 小 为 64M， 其 大 小 可 以 通过 数据 库 配 置 参 
数 LOGFILSIZ 调整 。 
e DB2 日 志文 件 是 以 二 进 制 形式 存储 ， 它 宕 要 特殊 的 工具 才 可 以 但 看 。 
e 日 志文 件 会 存储 在 指定 的 日 志 目 录 中 ， 由 数据 库 级 参数 (Path to log files) 指定 。 如 上 
例 中 为 /db2/db21de/data sampl/db21de/NODE0000/SQL00001/SQLOGDIR, 它 的 位 置 可 以 
通过 数据 库 配 置 参数 NEWLOGPATH 调整 。 
实际 上 ， 在 DB2 运行 的 过 程 中 , 一 个 日 志文 件 中 会 包含 多 个 事务 的 修改 记录 。 当 前 日 志文 
件 被 写 满 后 ，DB2 会 将 日 志文 件 序 号 目 动 加 1， 并 写 入 到 新 的 文件 中 。 
如 图 8-7 所 示 ，DB2 在 一 段 时 间 内 同时 处 理 6 个 事务 A. B. C. D. E 和 FF。 这 些 事务 首 
会 被 记录 在 日 志 绥 冲 区 中 ， 当 写 入 侯 副 的 条 件 满足 时 ， 这 些 日 志 记 录 会 向 写 入 到 磁盘 上 的 日 
志文 件 中 ， 一 个 日 志文 件 中 会 保存 多 个 不 同事 务 的 变化 记录 。 
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INS UPD | COMM UPD UPD UPD COMM 
事务 B 事务 FE 
INS DEL DEL COMM. INS COMM. 
事务 C 事务 F 
DEL COMMI INS COMM. 
E z yh E 
AIBICIAIBICIAIB IFIDIB|IFIDIEID|E|D| ESSE 
23325774 NNNM 
E D BONN Do NM D FIDIBIE'IDIEIDIEID 日 忘 文件 
(Log File? 
S0003320.LOG S0003321.LOG 
Ef (RE 


图 8-7 日 志文 件 的 使 用 


8.4. DB2 日 志 的 模式 


DB2 中 日 志 运 行 模式 分 为 两 种 ,循环 日 志 模 式 (Circular Logging) 和 归档 日 六 模式 (Archival 
Logging) . 
需要 注意 的 是 ， 无 论 循环 日 记 模 式 还 是 归档 日 志 模 式 ， 都 包含 主 日 志文 件 (Primary Log) 
和 辅助 日 志文 件 (Secondary Log) 。 
e 主 日 志文 件 是 记录 日 志 的 主要 文件 ， 在 DB2 启动 的 时 候 即 进行 分 配 ， 其 数目 由 参数 
LOGPRIMARY 确定 。 
e 辅助 日 六 文件 是 当主 日 忘 文件 已 满 时 ， 为 保证 当前 事务 可 以 被 继续 处 理 ， 投 照 需 要 分 
配 一 个 新 的 日 志文 件 ， 直 到 分 配 的 日 志 数 达到 规定 的 最 大 数目 。 如 果 这 时 还 不 能 完成 
当前 事务 ， 则 当前 事务 会 被 撤销 并 返回 错误 代码 至 上 层 应 用 程序 。 辅 助 日 志 参 数 由 
LOGSECOND 确定 。 
在 数据 库 配 置 参数 中 可 以 但 看 或 修改 主 日 六 个 数 CLOGPRIMARYO ) 、 辅 助 日 志 个 数 
(LOGSECONDO ) 和 日 志文 件 大 小 (LOGFILSIZ) 。 对 于 DBA 来 说 ， 可 以 通过 如 下 的 3 个 参 
数值 ， 计 算出 DB2 文 持 的 最 大 日 志 空 间 。 


SAHT LOGFILSIZ X (LOGPRIMARY I LOGSECOND) 


在 下 面 的 示例 中 ， 最 大 日 志 空 间 为 16380X4KBX (40-600 2 64 GB. 在 最 新 的 DB2 V9.7 
版 本 中 ， 日 志文 件 最 大 上 限 为 1024GB. 


Log file size (4KB) (LOGFILSIZ) - 16380 

Number of primary log files (LOGPRIMARY) - 40 

Number of secondary log files (LOGSECOND) = 60 

Changed path to log files (NEWLOGPATH) - 

Overflow log path (OVERFLOWLOGPATH) - 

Mirror log path (MIRRORLOGPATH) = 

First active log file = 60004695., LOG 
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Bhs eole mh ne lake (LOGARCHMETH1) - DISK:/db2/LDE/log archive/ 
Options for logarchmethi (LOGARCHOPT1) = 
Second log archive method (LOGARCHMETH2) = OFF 


1sits'do2lde 73> 


A Y X HGSORURE HS HUPCOU, PIRE PAIS] H RERA a o 
1. (BIB 


循环 日 六 模 式 是 默认 的 日 志 使 用 方式 。 顾 名 思 义 ， 循 环 日 志 的 工作 模式 指 的 是 ， 数 据 库 会 
问 设 定好 的 几 个 日 忘 文件 中 依次 写 入 日 六 记 录 ， 并 循环 往复 ， 它 会 履 兰 掉 以 前 使 用 过 的 文件 。 
如 图 8-8 所 示 ， 当 前 的 日 志 记 录 会 写 入 到 主 日 志 2 中 ， 当 主 日 志 2 写 满 后 ，DB2 会 依次 向 主 
日 志 3 和 主 日 志 4 中 写 入 。 若 均 已 写 满 ， 则 DB2 会 继续 使 用 主 日 志文 件 1 FAREA. 
另外 一 种 情况 ， 假 设 当 前 有 一 个 持续 时 间 很 长 的 事务 ， 将 主 日 志 2、 主 日 志 3 和 主 日 志 4 
均 已 写 满 ， 但 是 此 事务 还 没有 结束 〈 还 未 Commit) JJ DB2 会 自动 分 配 一 个 辅助 日 志 1， 继 
续 处 理 。 如 条 事 务 还 未 结束 ，DB2 会 继续 分 配 辅助 日 志 2、 辅 日 六 3 直到 辅助 日 志 最 大 值 。 这 
样 ， 此 事务 或 者 在 日 六 用 尽 后 被 回 滩 ， 或 者 在 之 前 成 功 完成 。 


循环 日 志 模 式 仅 支持 灾难 恢复 ， 数 据 库 离线 备份 和 版 本 恢复 等 恢复 方式 。 


(ZL A 数据 库 服务 器 


Transaction 


辅助 日 志文 件 
Secondary Log 
File 


辅 日 志 1 E 


Sell L 


Primary Log Ea 辅 日 志 n 
File 


图 8-8 DB2 循环 日 志 模 式 
2. 归档 日 志 模 式 


归档 日 志 模 式 是 生产 环境 下 的 常用 模式 。 如 图 8-9 所 示 , 它 也 是 使 用 4 个 主 日 志 循 环 写 入 。 
所 不 同 的 是 ， 在 归档 模式 下 ， 当 企图 产 以 前 的 日 志文 件 时 ，DB2 会 将 此 日 志文 件 归档 ， 从 而 
避免 被 窗 关 。 一 般 情 况 下 ， 需 要 在 生产 系统 或 主要 的 业务 系统 中 开局 归档 日 志 模 式 。 那 么 ， 使 
FEES HS He 29 23 78 FE Er P st ARTT A T Ab ? 

Hc. EHAN H BRA MEKE K, TEXOUS BITS CRollforward). 到 任意 
时 间 点 ， 这 保证 了 数据 库 中 的 数据 在 任意 时 刻 是 可 恢复 的 。 另 外 ， 开 局 归档 日 志 模 式 后 ， 可 以 
使 用 在 线 备 份 COnline Backup) 。 
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当前 事务 
e Transaction 


Dr 志 : [E 
， 只 是 存 


Y^ 
JN 


x 


Pun 
Æ 
ji 


活动 日 志 : 8 

括 未 被 Commit 

和 持久 化 事务 
的 日 志 


Comm — 


入 化 的 事务 
| ss | 
不 存在 于 日 志 目 录 存在 于 日 志 目 录 
图 8-9 DB2 归档 日 志 模 式 


N 


rh ETE EX EJ s» 如果 需要 开启 局 可 用 性 和 灾 备 特性 (HADR ) 或 使 用 日 志 传 输 (Log Shipping) 
功能 ， 也 必须 开启 归档 模式 。 

在 开局 归档 模式 后 ， 需 要 监控 产生 的 日 志文 件 是 否 被 正确 归档 到 磁盘 或 者 TSM 等 设备 上 。 
否则 ， 大 量 的 归档 日 六 会 苑 满 日 志文 件 夹 ， 从 而 导致 数据 库 系 统 立 即 停 机 。 

此 外 关于 归档 日 志 ， 有 下 面 儿 个 容易 混 消 的 概念 ， 需 要 大 家 理解 清楚 

(1) 活动 日 志 

数据 库 正 在 往 其 中 写 入 日 志 数 据 ， 或 者 其 中 包括 还 没有 提交 《Commit) 记录 的 那些 日 志文 
件 。 如 果 有 一 个 持续 人 均 为 活动 日 志 ， 则 为 了 保证 此 事务 的 正常 
完成 ， 则 数据 库 会 依次 分 配 辅助 日 志 。 注 意 ， 活 动 日 志 是 不 能 被 归档 的 。 

(2) 在 线 归 档 日 志 

在 线 归档 日 志 中 记录 的 所 有 事务 均 是 被 提交 的 ， 但 这 个 日 志 义 没有 从 日 志 目 录 中 转移 到 归 
档 目 录 中 ， 所 以 称 它 为 在 线 归 档 日 志 。 当 日 志 循 环 企图 宪 盖 在 线 归 档 日 志 时 ， 在 线 归 档 日 志 会 
被 转移 至 离线 归档 目录 变 为 离线 归档 日 志 . 

G) 离线 归档 日 志 

离线 归档 日 志 只 包括 已 提交 事务 日 志 ， 并 且 已 转移 到 离线 归档 目录 下 。 一 般 来 讲 ， 只 有 在 


做 数据 库 前 深 恢 复 时 才 会 使 用 离线 归档 日 站。 


归档 日 志 模 式 是 生产 环境 下 的 推荐 模式 ， 它 支持 灾难 恢复 、 数 据 库 在 线 备份 、 版 本 
恢复 、 前 滚 恢复 以 及 高 可 用 性 和 灾 备 (HADR) 等 


8.4.3 日 志 优 化 的 最 佳 实践 


当 iostat 或 者 perfmon 监控 工具 发 现 日 志 磁 盘 的 平均 UO 过 大 且 速 度 小 于 每 秒 50 次 VO ix 
号， 谨 明 出 现 了 日 忘 尊 贷 。 要 想 解 决 日 志 租 贷 ， 可 以 重 狐 调整 存储 设计 来 解决 ， 例 如 日 志和 数 
据 所 用 磁盘 物理 隔离 、 增 加 日 志 人 磁盘 个 数 等 。 
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但 是 很 多 时 候 ， 由 于 各 种 条 件 的 限制 ， 不 允许 DBA 重新 调整 存储 ， 所 以 只 能 减少 日 志 量 ， 
这 包括 下 面 的 手段 : 

e 对 拥有 BLOB 和 CLOB 等 大 对 象 字 段 的 表 使 用 NOT LOGGED 选项 ， 这 样 在 对 大 对 象 
进行 搬入、 删除 和 修改 时 ， 不 会 产生 大 量 的 日 志 。 

e 在 执行 ALTER TABLE 操作 时 ， 可 能 整个 表 的 数据 都 会 被 修改 ， 并 被 记录 日 六。 这 时 
候 可 以 使 用 NOT LOGGED INITIALLY 选项 来 减少 日 志 量 。 

e 对 临时 表 使 用 NOT LOGGED 选项 ， 这 样 就 不 会 记录 日 志 了 。 

e 在 大 批量 导入 数据 的 时 候 ， 尽 量 使 用 LOAD 工具 ， 这 是 因为 LOAD 工具 加 载 数据 时 不 
会 通过 DB2 引擎 ， 既 高 效 又 不 会 记录 日 志 。 

e 减少 COMMIT 的 次 数 。 每 次 执行 COMMIT 操作 都 会 写 日 志 。 如 果 可 能 ， 应 该 修改 应 
用 程序 ， 减少 COMMIT 次 数 ， 使 一 次 COMMIT 所 提交 的 修改 比较 多 ， 减 少 日 志 写 入 
磁盘 的 次 数 。 

e 增加 数据 库 参 数 MINCOMMIT 的 值 。MINCOMMIT 能 够 使 数据 库 延 迟 提 交 事 务 ， 直 到 
事务 提交 的 请 求 达 到 这 个 参数 指定 的 数目 。 

e 使 用 TRUNCATE 命令 来 清空 整个 表 。TRUNCATE 比 DELETE 速度 快 ， 而 且 记录 的 日 


二 量力 二 
e 使 用 压缩 功能 。 当 对 表 启 用 压缩 时 ， 日 志 记 录 的 数据 也 会 被 压缩 ， 这 样 就 减少 了 日 志 
的 IO FHE. 


8.5 并 发 机 制 比 较 : DB2 vs Oracle 


DB2 的 并 发 机 制 与 Oracle 的 并 发 机 制 存 在 很 大 区 别 。DB2 和 Oracle 在 并 发 机 制 上 不 同 的 
根本 原因 在 于 锁 与 日 志 的 实现 机 制 不 同 。 下 和 耐 来 比较 一 下 DB2 和 Oracle 4E 5; H is EJ PCR. 


85.1 锁 与 隔离 级 别 : DB2 vs Oracle 


DB2 的 锁 和 隔离 级 别 与 Oracle 的 实现 机 制 存在 很 大 区 别 。 总结 起 来 ， 这些 区 别 主要 体现 在 
以 下 几 个 方面 : 

(1) DB2 在 做 数据 修改 时 ， 在 日 志 中 既 记 录 了 修改 前 数据 《也 就 是 UNDO 日 志 ) ， 也 记 
录 了 修改 后 的 数据 ( 即 REDO 日 志 ) ifj Oracle 只 在 日 志 中 记录 修改 后 数据 ， 而 将 修改 前 的 数 
Fwi) “ERR” (ROLLBACK SEGMENT) 中 。 

(2) 在 Oracle 中 ， 当 一 个 应 用 程序 对 表 以 Insert, Update 和 Delete f&TEXETI EMIT, 5 
外 一 个 应 用 程序 在 读 取 该 表 时 ， 会 从 回 滚 段 中 读 取 该 表 最 近 修 改 前 的 数据 。 而 对 于 DB2 V9.7 
之 前 的 厂 本 ， 读 取 数 据 的 应 用 程序 ， 遇 到 正在 被 其 他 应 用 程序 修改 的 数据 时 ， 将 会 进行 锁 等 符 
(除非 使 用 UR 隔离 级 ) 。 对 于 DB2 V9.7 及 以 后 版 本 ， 由 于 引入 了 当前 已 落实 ， 读 取 数 据 的 应 
用 程序 将 不 需要 等 待 锁 释放 ， 而 是 会 从 日 志 中 读 取 数据 修改 前 的 版 本 〔( 即 已 落实 的 版 本 ， 相 当 
T Oracle 回 滚 段 中 的 数据 ) 。 
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(3) Oracle 利用 数据 行 上 的 标志 位 来 实现 锁 机 制 ， 而 DB2 是 通过 把 锁 信 息 记 录 在 锁 列 表 
(CLOCKLIST) 中 来 实现 的 。 当 请 求 加 锁 时 ，DB2 会 检查 锁 列表 ， 看 数据 对 象 上 是 否 已 加 锁 ， 
EJ Axis S) S 5 CUI BS A Ae T AE TE o 
(4) Oracle 数据 库 中 ， 对 数据 的 该 操作 是 不 加 锁 的 。 而 DB2 强调 “ 读 一 任性 ”， 在 读数 
据 行 时 ， 会 根据 隔离 级 的 不 同 而 加 S$ 或 IS 锁 ， 只 有 在 使 用 UR 陋 离 级 时 才 不 加 S EX IS 锁 ， 这 
保证 了 不 同 应 用 程序 和 用 户 恋 取 的 数据 是 一 致 的 。 默 认 情 况 下 ，Oracle 同一 时 刻 不 同 的 应 用 程 
序 有 该 不 一 致 的 现象 ， 而 DB2 在 同一 时 刻 所 有 的 应 用 程序 该 到 的 数据 都 是 一 致 的 。 
(5) Oracle 数据 库 中 不 存在 锁 升 级 ， 而 DB2 数据 库 中 当 锁 列表 (LOCKLIST) 被 耗 尽 ， 
或 者 单个 事务 锁 占 用 的 内 存 空间 超过 LOCKLISTX (MAXLOCKS/100) 个 页 时 会 发 生 锁 升级 。 
(6) DB2 缺 省 的 隔离 级 是 CS$， 对 于 大 多 数 应 用 来 说 ， 缺 省 的 CS 级 别 可 以 满足 需要 。Oracle 
的 默认 隅 离 级 read committed 和 CS 类 似 ， 通 过 多 版 本 机 制 ， 不 会 出 现 脏 读 现象 。 
(7) DB2 在 UR 隅 离 级 下 ， 遇 到 正在 被 更 改 的 数据 会 恋 最 新 的 没有 提交 的 脏 数 据 ， 而 Oracle 
在 其 所 有 的 隔离 级 CHI read committed. serializable 以 及 read-only) 下 都 不 会 读 取 脏 数 据 (在 
read committed 级 别 下 ， 会 从 回 深 段 中 直接 读 取 修改 前 的 曾经 提交 过 的 数据 ，〉。 在 一 些 应 用 中 ， 
要 读 到 最 独 的 数据 ， 也 束 是 脏 数据 。 对 这 两 种 方法 严格 来 说 并 没有 谁 好 谁 坏 ，ANSI 标准 也 
并 没有 明确 规定 。 


8.5.2 志 : DB2 vs Oracle 


8.4 节 介 绍 了 DB2 日 志 的 原理 和 模式 ,那么 DB2 的 日 志 与 Oracle 的 日 志 有 何 区 别 ? 它们 又 
分 别 是 如 何 运 行 和 管理 的 呢 ? 

DB2 在 做 数据 修改 时 ， 在 日 志 中 既 记 录 了 修改 前 的 数据 〈 也 就 是 UNDO 日 志 ) ， 也 记录 
了 修改 后 的 数据 CHI REDO 日 志 ) 。 而 Oracle 只 在 日 志 中 记录 修改 后 数据 ， 而 将 修改 前 的 数据 
记录 到 “ 回 深 段 ” (ROLLBACK SEGMENT) 中 。 

Oracle 数据 库 是 通过 重 做 日 志 (Redo Log) 和 重 做 日 志 绥 冲 区 (Redo Log Buffer) 来 对 数 
据 库 日 志 进 行 管理 。 同 时 ， 它 还 可 以 使 用 3 个 见 余 的 重 做 日 志 组 (Redo Log Group) 来 保证 在 
££ Hs HJ EAR 

在 Oracle 中 ， 其 在 线 日 六 的 运行 模式 又 分 为 2 种 : 非 归档 模式 (INOARCHIVELOGO ) 和 归 
档 模 式 (ARCHIVELOG)。 非 归档 模式 指 的 是 在 线 日 志 在 多 个 重 做 日 忘 组 中 循环 使 用 。 归 档 模 
式 是 指 多 个 重 做 日 志 组 循环 使 用 ， 当 所 有 的 日 志 组 被 用 尽 ， 回 到 初始 第 一 个 日 志 组 要 进行 覆盖 
前 ， 此 日 志 组 中 的 内 容 会 被 归档 到 其 他 位 置 。 

实际 上 ，DB2 5 Oracle 在 日 志 管 理 上 有 不 少 相 同 点 。 熟 悉 Oracle 的 朋友 可 以 体会 到 ， 几 
乎 所 有 在 Oracle 中 与 日 志 有 关 的 概念 ， 都 可 以 直接 在 DB2 中 找到 对 应 的 对 象 。 不 过 ， 与 DB2 
不 同 的 是 ， 在 Oracle 中 没有 主 日 志文 件 和 辅助 日 志文 件 这 样 的 区 别 。 


比较 : Oracle 与 DB2 日 志 术 语 对 比 


它们 之 间 的 对 比 ， 如 表 8-6 所 示 。 
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表 8-6 Oracle 与 DB2 日 志 术 语 对 比 


DB2 
重 做 日 志文 件 (Redo Log File ) 日 志文 件 (Log File ) 
重 做 日 志 缓 冲 区 (Redo Log Buffer ) 日 专 缓 冲 区 (Log Buffer) 
重 做 日 志 组 (Redo Log Group ) 镜像 日 志 路 径 (Mirrorlogpath ) 
非 归档 模式 (NOARCHIVELOG ) 循环 日 志 模 式 (Circular Logging ) 
归档 模式 CARCHIVELOG ) 归档 日 志 模 式 (Archival Logging ) 


对 于 并 发 控制 ， 无 论 是 DB2 还 是 Oracle， 都 有 目 己 的 特点 ，DBA 需要 根据 它们 不 同 的 特 
点 合理 设计 应 用 并 配置 好 相关 参数 。 


* * ^ 人 已 $ 
|| 
8.6 ”并 发 性 能 优化 
锁 与 日 志 在 DB2 中 都 是 资源 ， 它 们 是 并 发 控制 的 关键 ， 要 优化 锁 与 日 志 的 利用 效率 ， 要 有 灵 
活 运 用 各 种 策略 ， 精 打 细 算 ， 想 办 法 使 系统 并 发 性 最 大 人 化， 下面 束 从 应 用 程序 和 数据 库 两 方面 
出 发 ， 探 讨 如 何 优 化 并 发 性 能 。 


8.6.1 应 用 开发 


系统 的 并 发 性 能 很 大 程度 上 取决 于 应 用 的 好 坏 。 如 末 应 用 程序 对 DB2 的 并 发 机 制 使 用 不 
当 ， 比 如 事务 未 及 时 提交 、 使 用 不 当 的 隅 离 级 别 等 ， 那 么 会 产生 各 种 并 发 问题 。 


1. 编写 高 效 SQL 语句 


SQL 语言 非常 灵活 ， 可 以 使 用 多 种 写法 实现 同一 功能 ， 但 是 最 高 效 的 只 有 一 种 。 本 书 第 9 
章 9.5 小 节 深入 探讨 了 如 何 编写 高 效 SQL 语句 ， 读 者 可 以 学 习 一 下 。 


2. 创建 合适 索引 

创建 合适 索引 ， 优 化 器 束 可 以 通过 索引 扫 接 只 访问 符合 索引 条 件 的 行 ， 并 对 它们 加 行 锁 ， 
这 样 束 减少 了 加 锁 数 量 ， 如 果 使 用 限定 数据 范围 的 查询 条 件 (Range Predicate) ， 将 会 进一步 
减少 行 锁 。 但 是 索引 过 多 会 导 作 插入、 更 新 和 删除 操作 的 性 能 ， 索 引 不 是 越 多 越 好 。 一般 来 说 ， 
OLTP 系统 ， 一 个 表 上 的 索引 3~5 个 比较 合适 ，OLAP 系统 ，5~8 个 比较 合适 。 


3. 编写 高 效 事务 


在 应 用 程序 中 ， 要 编写 高 效 事务 : 

CD 在 应 用 逻辑 允许 的 情况 下 尽早 使 用 COMMIT 语句 来 提交 事务 , 以 减少 持 有 锁 的 时 间 ， 
并 释放 日 志 资 源 。 应 用 程序 发 生 错误 时 ， 也 应 该 及 时 回 滚 事务 ， 释 放 相 关 锁 与 日 志 资 源 。 

(2) 尽量 不 要 在 事务 中 加 入 执行 时 间 过 长 或 不 必要 的 代码 ， 比 如 大 的 代码 循环 和 远程 调 
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用 ， 如 果 有 这 些 逻 辑 ， 尺 量 放 在 读 取 数据 或 者 更 新 数 据 之 前 ， 或 者 事务 提交 以 后 ， 这 样 束 能 减 
少 锁 的 占有 时 间 。 

G) 在 事务 中 应 该 尽量 晚 地 访问 关键 数据 ， 也 就 是 尽量 把 对 关键 数据 的 访问 帮 到 事务 即 
将 扣 交 时 ， 这 样 能 最 大 限度 的 减少 锁定 关键 数据 的 时 间 。 

(4) 如 末 多 个 应 用 程序 访问 相同 的 一 系列 资源 ， 应 该 授 相 同 的 顺序 依次 访问 ， 这 样 可 以 
避免 了 和 死 锁 的 发 生 。 

(5) 尺 可 能 快 地 关闭 游标 。 因 为 使 用 游标 时 会 锁定 游标 当前 指 问 的 数据 ， 而 关闭 游标 ， 
可 以 释放 锁 。 


4. 灵活 运用 DB2 提供 的 高 级 设计 技术 


在 第 5 章 谈 到 表 分 区 、MDC、MQT 等 高 级 技术 ,灵活 运用 它们 ， 可 以 取得 事半功倍 的 效果 。 
8.6.2 数据库 调 优 


在 应 用 程序 开发 的 时 候 ， 使 用 上 述 建议 能 够 减少 将 来 出 现 并 发 问题 的 可 能 性 。 但 是 ， 这 还 
人 不够 ， 还 需要 从 数据 库 层 向 进行 必要 的 调 优 工作 。 


1. 设置 合适 的 隔离 级 


从 8.2.1 B ffs), DB2 提供 了 四 种 隔离 级 ,按照 严格 程度 ， 从 高 到 底 为 , 分 别 为 RR、RS、 
CS 和 UR。 隔离 级 越 高 ， 数 据 稳定 性 越 好 ， 但 是 并 发 性 能 越 差 。 

为 了 设 定 合适 的 隔离 级 ， 首 先 需 要 确定 都 运行 了 哪些 应 用 程序 ， 这 些 应 用 程 对 数据 稳定 性 
和 高 并 发 性 有 什么 样 的 需求 ， 随 后 根据 这 些 需 求 在 不 同 层次 选择 不 同 的 隔离 级 。 

例如 , 在 笔者 的 一 次 调 优 工作 中 , 将 一 些 报表 应 用 的 隔离 级 由 CS 改 为 UR. 解决 了 锁 等 待 ， 
使 得 平均 啊 应 时 间 从 几 分 钟 降 到 儿 秒 ， 直 接 增加 了 系统 的 知 吐 量 ， 避 免 了 为 了 文 持 更 多 用 户 而 
升级 系统 人 硬件 。 

如 果 应 用 逻辑 允许 ， 尽 量 激 活 DB2 V9.7 提供 的 当前 已 落实 特性 ， 这 能 有 效 提 升 数据 库 的 
并 发 性 。 


2. 设置 合理 的 锁 参 数 和 日 志 参 数 


锁 参 数 包 括 LOCKLIST、MAXLOCKS、DLCHKTIME 和 LOCKTIMEOUT, 日 志 参 数 包括 
LOGFILSIZ、LOGPRIMARY、LOGSECOND 和 LOGBUFSZ， 它 们 的 设 定 参 见 第 7 XE 7.1.3 小 
他 。 在 高 并 发 情况 下 ， 这 些 参 数 如 果 设 置 不 当 会 形成 瓶 贷 ， 严 重 影响 并 发 性 。 从 最 大 并 发 性 出 
发 ， 要 设置 好 这 些 参数 。 


3. 优化 天 键 SQL 语句 


占用 资源 多 、 运行 频 率 蝇 的 关键 SQL 语句 对 并 发 性 影响 很 大 ,它们 通常 占用 了 大 量 锁 资源 

(长 时 间 持 有 锁 、 占 用 大 量 锁 内 存 等 ), 要 通过 分 析 访 问 计 划 , 对 这 些 关 键 SQL 语句 进行 优化 ， 

从 而 降低 它们 因为 持 有 锁 所 产生 的 资源 消耗 。 关 于 有 具体 的 优化 方法 ， 请 参考 本 书 第 9 章 的 有 关 
内 容 。 


DB2 设计 、 管 理 与 性 能 优化 艺术 


8.7 小结 


KEI DB2 并 友 控 制 进行 了 详尽 地 阐述 。 首 先 从 整体 上 介绍 了 学 习 和 竺 握 DB2 并 发 机 制 
的 方法 。 接 看 介绍 了 并 发 机 制 中 的 事务 、 锁 和 隔离 级 的 原理 和 相关 例子 。 然 后 介绍 了 并 发 问题 
的 监控 和 分 析 方 法 ， 对 锁 等 待 、 锁 超时 和 和 死 锁 进行 了 全 面 的 分 解 与 曾 述 。 最 后 介绍 了 如 何 实现 
DB2 并 发 性 的 最 大 化 ， 提 出 了 诸多 实际 操作 建议 和 规范 。 

锁 是 保证 数据 一 致 性 的 机 制 ,， 而 日 六 是 保护 数据 的 最 基本 胰 略 。 本 章 还 介绍 了 DB2 日 志 原 
理 和 模式 ， 并 和 Oracle 进行 了 比较 。 

通过 本 章 的 学 习 ， 恋 者 能 够 深入 理解 DB2 的 并 友 机 制 和 日 忘 原理 , 活 学 活用 , 在 系统 设计 
和 性 能 调 优 工作 中 ， 能 游历 有 余地 处 理 各 种 并 发 问题 。 
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SQL 语句 优化 实战 


SQL 语句 优化 至 关 重 要 ， 这 是 因为 它 对 性 能 影响 大 ， 例 如 很 多 性 能 瓶颈 都 是 由 耗费 资源 的 

关键 SQL 语句 ( Costly SQL ) 导致 的 。 

特别 重要 的 是 , SQL 语句 优化 持续 周期 长 , 往往 贯穿 设计 、 开 发 和 运行 维护 整个 生命 周期 ， 

e 设计 阶段 : 设计 人 员 不 仅 要 关注 数据 模型 ， 还 要 确保 表 和 索引 的 优 民 设计， 从 而 确保 
SQL 语句 的 高 效 执行 。 

e 开发 阶段 : 很 多 开发 人 员 编写 的 SQL 语句 性 能 低下 ， 需 要 优化 其 中 的 关键 SQL， 以 满 
足 业 务 的 性 能 需求 。 

e 运行 维护 阶段 : 随 着 数据 本 身 的 变化 特别 是 数据 量 的 大 幅 增 加 ， 数 据 库 的 性 能 开始 变 
$, DBA 需要 优化 某 些 关键 SQL 来 提 
升 性 能 。 

SQL 优化 的 前 提 是 通过 监控 发 现 问题 SQL 


语句 ， 读 者 可 以 参考 第 6 章 6.4 节 的 相关 内 容 。 
找到 关键 的 问题 SQL 语句 后 ， 就 可 以 对 它们 采 


取 针 对 性 的 优化 方案 了 。 

但 是 ，SQL 语句 优化 不 是 一 件 容易 的 事 ， 
需要 掌握 正确 的 方法 , 即 深入 理解 DB2 优化 器 ， 
掌握 分 析 和 调整 访问 计划 的 方法 ， 并 加 以 不 断 
地 实践 ， 才 能 逐渐 掌握 SQL 语句 优化 的 技能 。 

“ 授 人 以 鱼 不 如 授 人 以 渔 ”， 本 章 将 深入 
讲解 SQL 语句 优化 原理 和 最 佳 实践 。 


A^ = 
j EN * 章 
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9.1 SQL 优化 基础 ， 理 解 DB2 优化 器 


优化 器 是 DB2 的 大 脑 ，SQL 语句 在 DB2 引擎 中 执行 以 前 ， 首 先 需要 优化 器 为 其 生成 访问 
计划 。 正 如 在 战争 中 ， 错 误 的 作战 计划 可 能 导致 全 军 履 没 一 样 ， 错 误 的 访问 计划 也 会 导致 SQL 
语句 执行 效率 低下 甚至 拖累 整个 系统 。 

本 节 将 首先 讲解 SQL 语句 的 编译 过 程 ， 随 后 探讨 DB2 优化 器 的 工作 原理 。 

9.1.1 SQL 语句 的 编译 过 和 


如 图 9-1 所 示 ，SQL 语句 的 编译 过 程 需 要 经 过 下 面 儿 个 步骤 : 
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图 9-1 SQL 语句 编译 过 程 


(1) 分 析 语法 (Parse Query) : 编译 占 从 语法 层面 分 析 SQL 语句 ， 如 果 检 测 到 任何 语法 
首 误 ， 束 会 停止 处 理 ， 返 回 相 应 的 错误 提示 给 用 户 。 经 过 语法 分 析 后 ，SQL 语句 束 被 转换 成 内 
部 表示 形式 ， 即 QGM (Query Graph Model) ，QGM 用 图 结构 来 表示 SQL 语句 ， 后 续 的 编译 
过 程 将 围 比 QGM 展开 。 

(2) AEX (Check Semantics) : 编译 器 从 语义 层面 分 析 SQL 语句 ， 例 如 类 型 检查 、 
参照 完整 性 约束 、 触 上 友 器 和 检 答 约束 等 ， 语 义 分 析 后 的 对 象 也 加 到 QGM 中 。 

(3) ESAN (Rewrite Query) : 在 不 改变 语义 的 基础 上 ， 对 查询 进行 等 价 变 换 。 例 如 ， 
将 谓词 下 推 到 基本 表 作 为 局 部 谓词 ; 用 MOT ESAW; 将 子 人 查询 转换 成 连接 。 

例如 ， 下 面 的 SQL 语句 使 用 了 IN FAH: 


$93 SOL 4 4445: 


SELECT EMBPNO, FIRSTNME, LASTNAME, PHONENO 
FROM EMPLOYEE 
WHERE WORKDEPT IN (SELECT DEPTNO FROM DEPARTMENT WHERE DEPTNAME = 'OPERATIONS'"') 


IN FAWR MNE, METRE SR IE IS TE RPRXEBE TIE: 


SELECT DISTINCT EMPNO, EITRSTNME, LASTNAME, PHONENO 
FROM EMPLOYEE EMP, DEPARTMENT DEPT 
WHERE EMP.WORKDEPT = DEPT.DEPTNO AND DEPT.DEPTNAME = 'OPERATIONS"' 


(4) 下 推 分 析 CPushdown Analysis) : 处 理 联 邦 查 询 (Federated Query) 独 有 的 步骤 ， 其 
主要 任务 是 人 确定 但 询 中 的 哪些 操作 可 以 放 到 远程 数据 源 执行 。 

(5) 优化 访问 计划 (COptimize Access Plan) : 优化 器 分 机 QGM， 根 据 表 和 索引 上 的 统计 
信息 ， 并 参考 当前 数据 库 的 各 种 参数 配置 ， 佑 计 各 种 访问 计划 的 成 本 ， 然 后 选择 成 本 最 小 的 计 
划 作 为 最 终 的 访问 计划 。 

(6) 远程 SQL 生成 (Remote SQL Generation) 。 处 理 联 邦 查 询 时 独 有 的 步骤 ， 编 译 器 会 
根据 远程 表 的 访问 计划 ， 生 成 用 于 在 远程 数据 源 执行 的 SQL 语句 。 

CI) 生成 可 执行 代码 (Generate Executable Code) : 编译 器 根据 访问 计划 和 QGM 生成 一 
个 可 由 DB2 引擎 执行 的 二 进 制 代 人 码 段 (Section) 供 DB2 运行 时 使 用 。 这 个 代码 段 不 可 读 ， 其 
中 包含 的 访问 计划 信息 可 以 通过 工具 db2expln 但 看 。 


9.1.2 DB2 优化 器 的 核心 作用 


在 SQL 编译 过 程 中 ,最 核心 的 步 又 便 是 生成 和 优化 访问 计划 。 下 面 探讨 一 下 优化 器 的 作用 ， 
如 图 9-2 所 示 ， 包 含 下 面 的 要 点 : 


系统 与 数据 库 配 置信 息 : 


CPU 速 度 、1/O 速 度 、 绥 冲 池 、 
排序 堆 、 优 化 级 别 等 


SELECT ... 
FROM... [一 一 > 


图 9-2 DB2 优化 器 的 核心 作用 


(1) 以 SQL 语句 作为 输入 : 优化 右 将 重点 考 夸 SQL 中 谓词 的 处 理 效率 和 表 的 连接 方式 。 

(20 系统 与 数据 库 的 设置 : 优化 融会 充分 若 夸 CPU 速度 、 存 储 的 IO 速度 、 并 行 模式 、 
并 及 环境 、 优 化 级 别 、 组 冲 池 和 排序 堆 大 小 等 。 

(3) 表 和 索引 统计 信息 : 统计 信息 是 优化 右 进 行 SQL 语句 优化 的 基础 。 
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(4) 生成 最 优 访问 计划 : 优化 器 充分 考虑 表 访 问 方式 、 连 接 方法 以 及 操作 顺序 ， 生 成 各 
种 可 能 的 访问 计划 ， 并 根据 成 本 模型 计算 每 个 访问 计划 的 成 本 ， 最 后 选择 一 个 总 成 本 最 小 的 访 
问 计 划 。 


9.1.3. SQL 语句 优化 过 程 


了 解 SQL 语句 的 编译 过 程 和 DB2 优化 器 原理 后 ， 理 解 SQL 语句 的 优化 过 程 就 很 容易 了 ， 
一 般 包 括 下 面 四 个 步 又 ; 

(D 通过 性 能 监控 ， 发 现存 在 性 能 问题 的 关键 SQL 语句 。 关 于 性 能 监控 的 方法 请 参考 第 
6. 

(2) 分 析 SQL 语句 的 访问 计划 ， 找 到 问题 的 原因 所 在 ， 比 如 索引 人 缺失、 数据 库 参 数 设置 
不 合理 、 统 计 信息 不 准确 或 者 更 新 不 及 时 等 。 

(3) 调整 SQL 语句 的 访问 计划 ， 例 如 添加 索引 、 调 整数 据 库 参 数 、 修 改 SQL 语句 等 。 

(4) 进行 性 能 验证 ， 确 保 调 优 措施 有 效 。 

在 这 四 个 步骤 中 ， 关 键 点 是 分 析 和 调整 SQL 语句 的 访问 计划 。 


9.2 SQL 优化 天 键 : 分 析 访 问 计 划 


上 一 节 我 们 探讨 了 DB2 优化 器 ， 这 是 掌握 SQL 语句 优化 的 理论 基础 。 本 节 将 深入 探讨 SQL 
语句 优化 的 关键 点 ， 即 如 何 使 用 工具 生成 关键 SQL 语句 的 访问 计划 ， 如 何 分 析 访 问 计 划 ， 找 到 
性 能 问题 的 原因 所 在 ， 从 而 找到 优化 关键 SQL 语句 的 办 法 。 最 后 介绍 使 用 优化 概要 定制 访问 计 
划 的 方法 ， 这 也 是 SQL 优化 的 有 力 武器 。 


9.2.1 解释 (Explain) 工具 


DB2 的 解释 工具 (Explain Tool) 能 打印 出 SQL 语句 的 访问 计划 ， 从 而 用 于 分 析 以 确认 性 
能 问题 所 在 。 为 了 但 看 访问 计划 ，DB2 y =P HH LCH: Visual Explain, db2exfmt 和 
db2expln， 下 面 分 别 介绍 。 


比较 : Explain 工具 的 区 别 


e db2exfmt: 命令 行 工 具 ， 将 访问 计划 输出 为 文本 形式 ， 包 含 最 详尽 的 信息 。 

e db2expln: 命令 行 工 具 ， 打 印 出 代码 段 (section) 中 的 访问 计划 信息 ， 并 可 用 于 打印 已 
有 存储 过 程 中 静态 SQL 语句 的 访问 计划 。 

e Visual Explain: 图 形 化 的 Explain 工具 ， 控 制 中 心 、Data Studio. Toad 等 都 文 持 图 形 化 
的 解释 工 其 。 
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1. db2exfmt 


db2exfmt 是 最 DUUM 令 行 解释 工具 ， 它 在 各 种 平台 通用 ， 而 且 它 输出 的 访问 计划 包含 详 
细 的 优化 器 信息 。 在 一 些 安全 管理 比较 严格 的 客户 那里 ， 只 能 使 用 命令 行 或 者 不 让 安装 使 用 图 
形 化 工具 ， 这 时 db2exfmt 就 能 派 上 用 场 。 

使 用 db2exfmt 工具 前 ， 震 要 创建 相关 的 解释 (explain〉 表 。 先 切换 到 目录 sqllib/misc 
(windows 平台 为 SQLLIBAMISC) 下 ,然后 执行 EXPLAIN.DDL 脚本 ， 用 于 创建 一 组 相关 联 的 
X. Ul NT. 


clo =tyvf EXPLAIN- DDL 


& ££ ORE e HN] 2 -PAREHA E, EPELA "C" WE ALAE. 
相应 的 ， 如 果 传 入 参数 “D”， 则 表示 删除 这 些 explain 表 。 


call sysproc.sysinstallobjects ("EXPLAIN',“"C','" ENS 


用 db2exfmt 获取 SQL 访问 计划 的 步骤 很 徐 单 , 它 的 运行 方式 如 下 所 示 。 在 explain 模式 下 ， 
DB2 只 编 详 而 不 会 执行 租 询 , 编译 得 到 的 访问 计划 写 入 到 解释 表 中 , 然后 db2exfmt 从 解释 表 中 
起 取 相关 内 容 ， 并 格式 化 输出 成 用 户 可 读 的 访问 计划 

db2 explain plan for select ...; 

cdloz2exfmrEe =el <cdlo name> =1 conu Mc 

或 者 


db2 set current explain mode explain 


select ... 
db2 set current explain mode no 
dlo2exfmt exe SOUS. name> =1 =© <outputitile> 


人 注意 : 解释 含 参数 标记 的 动态 SQL 
含有 参数 标记 的 SQL 语句 也 可 以 用 db2exfmt 生成 其 访问 计划 。 如 explain plan for 
select C CUSTOMER SK from tpcds.customer where C BIRTH YEAR - ? 


Aa 小 技巧 : 清除 explain 表 中 的 旧 数据 
DB2 在 解释 查询 时 只 会 向 explain 表 里 面 插入 新 数据 ， 不 会 删除 旧 数 据 。 随 着 解释 
SQL 语 多 的 次 数 越 来 越 多 ， 解 释 表 会 越 来 越 大 ， 这 时 可 以 用 下 面 的 命令 把 所 有 的 解释 数 
据 删 除 : 


el from EXPLAIN INSTANCE 


2. db2expln 


与 db2exfmt 不 同 ，db2expln MARRE E PITEN B R CASE 9-10 ， 它 不 需要 创建 解 
释 表 ， 使 用 起 来 更 加 方便 。 

使 用 db2expln 命令 的 语法 如 下 所 示 ， 其 中 选项 -statement 指定 需要 解释 的 SQL 语句 ， 选 项 
-g 指定 打印 出 树 形 的 访问 计划 ，-o 指定 输出 文件 。 
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db- oI ee statement Sol er ee POMERI Re Tromp Cr Eom were 
BR 


也 可 以 将 SQL 语句 放 在 文件 〈 比 如 statements.sqD) 中 ， 这 时 db2expln 的 命令 如 下 ， 其 中 
-stmtfile 指定 包含 SQL 语句 的 文件 名 : 


dbZexpln -d tpcds -stmtfile statements.sqi -g -o expln.output 


输出 的 访问 计划 主要 内 容 如 下 所 示 ， 前 半 部 分 用 层次 结构 表示 访问 计划 ， 后 半 部 分 树 形 访 
问 计划 图 则 和 db2ex fmt 命令 的 输出 类 似 , 不 过 它 不 会 包含 每 个 操作 符 的 详细 信息 。 注意 加 黑 的 
“ID = 2,6”， 其 中 2 为 表 空间 ID， 6 为 表 ID. 


Section Code Page = 1208 


Estimated Cost = 15.473010 
Estimated Cardinality = 74.000000 


Access Table Name = DB2INST1.EMPLOYEE ID = 2,6 
#Columns = 3 
Skip Inserted Rows 
Avoid Locking Committed Data 
Currently Commicrtec for Cursor Stability 
May participate in Scan Sharing structuree 
Scan may start anywhere and wrap, for completion 


Fast scan, for purposes of scan sharing management 


| 
| 
| 
| 
| 
| 
| 
| Scan can be throttled in scan sharing management 
| Relation Scan 
| | Prefetch: Eligible 
OCKE S 
| | Tables Intent Share 
| | Row : Next Key Share 
| Sargable Predicate(s) 
| | Process Build Table for Hash Join 
Hash Join 
Estimated Build Size: 4000 
Estimated Probe Size: 8000 
Access Table Name = DB2INST1.DEPARTMENT ID = 2,5 
#Columns = 2 
Skip Inserted Rows 
Avoid Locking Committed Data 
Currently Conmitted for Cursor Stability 
May participate in Scan Sharing Structuree 
Scan may start anywhere and wrap, for completion 


Fast scan, for purposes of scan sharing management 


Relation Scan 

| Prefetch: Eligible 
Lock Intents 

| Tables Intenet Share 

| Row : Next Key Share 


| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| Sargable Predicate (s) 
| 


| 
| 
| 
| 
| 
| 
| 
| Scan can be throttled in scan sharing management 
| 
| 
| 
| 
| 
| 
| 


| Process Probe Table for Mash Join 


336 


$93 SQL 语句 优化 实战 


Return Data to Application 
| #Columns = 3 


EnG 0f SecrTLon 


(pum zc 


Rows 
Operator 
(TD) 
COST 


74 
n/a 
RETURN 
Cody 
15,473 
| 
14 
n/a 
HSJOIN 
( 2) 
15,473 
1 N 
102 74 
n/a n/a 
TBSCAN TBSCAN 
( 3) (o4) 
To 713946 To 1015 
| | 


102 74 

n/a n/a 
Table: Table: 
DEZATEN IDE SZ NNI STE 


DEPARTMENT EMPLOYEE 


尽管 db2expln 的 输出 没有 db2exfmt 详尽 , 但 它 却 有 独特 的 用 武之 地 : 打印 出 已 创建 的 SQL 
存储 过 程 〈 或 者 程序 包 ) 的 访问 计划 ， 这 对 分 析 存 储 过 程 的 性 能 相当 有 用 。 

下 面 的 例子 用 db2expln 获取 SQL 存储 过 程 DB2INSTI.SP 的 访问 计划 : 先 从 系统 编目 中 找 
到 相应 的 程序 包 名 ， 然 后 用 db2expln 打印 出 该 程序 包 的 访问 计划 。 


首先 根据 存储 过 程 名 字 找 到 程序 包 和 名， 这 里 为 P7544528 
db2 "select r.ROUTINESCHEMA, r.ROUTINENAME, d.BNAME, d.BSCHEMA 


from syscat.routines r, syscat.routinedep d 
where r.ROUTINESCHEMA='DB2INST1' and r.ROUTINENAME='SP' 
ancl c SPECIPFICNAME = Co SPECIPFITCNAME ane! Clo BI PH =Y KY W 
接着 ， 打 印 出 程序 包 P7544528 的 访问 计划 
cdo2expln =c tpecs =e DB2INSTIL =p P7544526 =-0 =@ sp- expln 
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人 注意 : SQL 存储 过 程 的 访问 计划 
SQL 存储 过 程 的 访问 计划 可 以 通过 db2expln 获取 ， 如 果 要 用 db2exfmt 抓 取 更 为 详 
尽 的 访问 计划 ， 这 就 需要 在 创建 存储 过 程 之 前 设置 EXPLAIN YES 这 个 编译 选项 了 。 有 
两 种 方法 来 设置 这 个 选项 : 
e 调用 存储 过 程 SET ROUTINE OPTS 设置 EXPLAIN YES 编译 选项 , 于 是 在 当前 
会 话 中 创建 的 SQL 存储 过 程 ，DB2 会 将 其 访问 计划 写 入 到 解释 表 中 ， 从 而 可 以 
用 db2exfmt 工具 获取 。 在 每 次 rebind 的 时 候 ， 该 存储 过 程 中 的 SQL 语句 会 重新 
编译 ， 其 访问 计划 也 将 重新 被 写 入 到 解释 表 。 


CALD SAT ROUTINE OPTS ("EXPLAIN Vas") 


e 设置 注册 变量 DB2 SQLROUTINE PREPOPTS， 这 需要 重新 启动 DB2 实例 才能 
生效 ， 随 后 创建 的 SQL 存储 过 程 将 能 用 db2exfmt 抓 取 访 问 计 划 。 


Do2set DB2 SOLROUTINE PREPOPTS="EXPLAIN YEO 


3. Visual explain 


图 形 化 的 解释 工具 操作 简单 , 显示 的 访问 计划 形象 直观 .用 DB2 控制 中 心 的 Visual Explain 
解释 查询 的 效果 如 图 9-3 所 示 。 它 对 访问 计划 图 中 的 各 种 节点 进行 不 同 着 色 ， 直 观 清晰 。 


.Overvie w -lol xi 


概览 窗口 


PATTIC - INST1 - TP1 
Ten Package: NULLID.SYSSH200 Section nu. 

基本 信息 — n date and time: 06/06/2003 9:24:28 PM — Parallelis.. 

Data Joiner: No 

Total costitimerons): 75.08 


EXE: 
PATTIC - INST1 - TP1 
[select * 


from acct 
where acct id = 30000 


原始 查询 


操作 节点 


| Close | Help | 


PATTIC - INST1 - TP1 


[SELECT 30000 AS "ACCT. ID", 
[Q1."NAME" AS "NAME", Q1."ACCT. GRP" 
| AS"ACCT. GRP", Q1 "BALANCE" AS 
"BALANCE", Q1 "ADDRESS" 

AS "ADDRESS", Q1 "TEMP" AS "TEMP" 
IFROM PATTIC.ACCT AS Q1 
WHERE (Q1^"ACCT. ID" = 30000) 


| | 
| Print... | Close | Help | 


对 象 节 点 (索引 ) 
优化 后 的 查询 


PATTIC.ACCT 


图 9-3 DB2 控制 中 心 的 Visual Explain 示例 


其 他 一 些 图 形 化 工具 如 Data Studio. Toad for DB2 等 也 能 直接 分 析 访 问 计 划 。 


9.2.2 解读 访问 计划 
本 章 的 访问 计划 解读 主要 基于 db2exfmt 的 输出 ， 因 为 它 包 含 最 详细 的 优化 器 信息 。 
总 体 来 说 ，db2exfmt 打印 出 的 信息 主要 包含 下 面 的 部 分 ， 与 图 9-2 中 优化 器 的 输入 和 输出 


相对 应 : 
e 全 局 上 下 文 信息 : 包括 数据 库 配 置 、 优 化 级 别 和 隔离 级 别 等 。 
e SQL 语句 文本 : 包括 原始 SQL 语句 和 优化 后 的 SQL 语句 。 
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e 访问 计划 : 包含 访问 计划 图 和 每 个 操作 符 的 细节 信息 ， 访 问 计 划 中 用 到 的 对 象 以 及 统 
HRE., UHER, RIE. 
1. 全 局 上 下 文 信息 


在 db2exfmt 输出 的 开始 部 分 ,包含 看 丰 主 的 上 下 文 信息 ， 这 些 信 息 直 接 影 啊 访 问 计划 的 生 
成 ， 在 分 析 时 不 可 忽视 。 
如 下 所 示 ， 一 个 访问 计划 的 全 局 上 下 文 信息 : 


*CkCk Ck X XCk ck Kk KCk Ck ck k kk k kk EXPLAIN INSTANCE 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 类 类 大 大 


DB2 VERSION: 09.07.4 

SOURCE NAME: SOLC2H21 

SOURCE SCHEMA: NULLID 

SOURCE VERSION: 

EXPLAIN TIME: 2013-02-28-11.35.17.327941 


EXPLAIN REQUESTER: DBZINSTI 


Database Context: 


Parallelism: None 

CPU Speed: 5.707493e-07 
Comm Speed: 150: 

Buffer Pool size: 13740 

Sort Heap size: 56 

Database Heap size: 2271 

Koek SES 4096 
Maximum Lock List: 97 


Average Applications: 1 
Locks Available: 127139 


Package Context: 


SQL Type: ID:ergie mE s 
Optimization Level: 5 

Blocking: Block All Cursors 
Isolation Level: Cursor Stability 


---------------- STATEMENT 1 SECTION 203 ---------------- 


QUERYNO: 1 
QUERYTAG: 

Statement Type: Select 
Updatable: No 
Deletable: No 
Query Degree: 1 


那么 怎么 解 谈 上 面 的 得 出 内 容 呢 ? 主要 包括 如 下 内 容 : 

(1) DB2 版 本 和 生成 访问 计划 的 时 间 : 版 本 为 V9.7.4， 生 成 时 间 为 2013 5E 2 H 28 H 1 
时 35 分 。 

(2) 数据 库 管 理 需 的 配置 : 包括 并 行 方式 (Parallelism) ~ CPU 速度 和 通信 带宽 。 
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e 并 行 方式 可 以 为 None( 疫 有 并 行 )、Intra-Partition Parallelisn SMP 并 行 ) 和 Inter-Partition 
Parallelism( DPF 或 者 MPP 模式 )。 在 并 行 模式 中 ,访问 计划 中 可 能 出 现 TQCTable Queue? 
PRETI, WI LIQ、BTQ、DTQ 等 。TQ 以 下 的 访问 计划 部 分 将 在 不 同 的 DB2 代理 或 者 
节点 之 加 并 行 执 行 ， 而 TQ 则 用 于 在 不 同 的 代理 或 者 节点 之 间 传 输 数 据 。 

e CPU 速度 : DB2 会 自动 获取 服务 器 的 CPU 速度 ， 对 应 DBM 的 参数 为 CPUSPEED。 一 
般 不 需要 目 动 设置 ， 在 模拟 客户 环境 分 析 SQL 语句 的 访问 计划 时 ， 可 以 手动 设置 。 

e 通信 带宽: 在 DPF 环境 下 ， 各 个 节点 相互 之 间 通 信 时 的 带宽 ， 对 应 于 DBM 2X 
COMM BANDWIDTH 的 设置 。 

(3) 数据 库 配 置 包含 内 存 和 锁 的 设置 ， 大 多 可 以 从 数据 库 配 置 中 找到 相应 的 值 。 

e Buffer Pool Size: 数据 库 中 所 有 缓存 池 的 大 小 总 和 。 分 析 访 问 计 划 时 这 个 参数 并 不 可 靠 ， 
因为 DB2 的 表 和 索引 都 有 关联 的 缓存 池 ， 只 需 关 心 相 关 的 缓存 池 大 小 。 

e Sort Heap Size: 一 个 排序 可 用 的 最 大 内 存 ， 另 外 ， 哈 希 连 接 用 的 内 存 也 是 排序 堆 。 泵 
例 中 所 用 数据 库 的 SORTHEAP 配置 为 AUTOMATIC (56) ， 因 而 此 处 排序 堆 的 大 小 
为 56。 

e Average Applications: 对 应 数据 库 配 置 参数 AVG APPLS, 表明 平均 有 多 少 用 户 连 接 这 
个 数据 库 ，DB2 优化 恬 优 生成 访问 计划 时 会 根据 这 个 参数 来 分 配 可 用 的 内 存 资源 和 锁 

(40 语句 级 别 上 下 文 : 包括 优化 级 询 、 隔 离 级 别 和 SMP 并 行 度 等 。 

e Optimization Level (优化 级 别 ) : 可 以 为 0、1、2、3、5、7、9， DB2 根据 数据 库 配 
置 参 数 DFT_ QUERYOPT 获得 默认 配置 ， 默 认为 S。 优 化 级 唱 越 高 ， 优 化 器 需要 考虑 的 
访问 计划 也 就 越 多 ， 编 译 时 间 也 就 越 长 。 对 OLAP 应 用 ， 可 以 使 用 较 高 的 优化 级 别 ; 
对 于 高 并 发 的 OLTP 应 用 ， 则 可 以 选择 较 低 的 优化 级 别 ， 一 般 情况 下 ， 使 用 默认 5 KL 
行 。 在 当前 会 话 中 ， 可 以 为 SQL 语句 设置 优化 级 别 ， 例 如 : SET CURRENT QUERY 
OPTIMIZATION = 3. 

e Isolation Level (隔离 级 别 ) : 可 以 为 UR、CS、RS 和 RR， 请 参考 第 8 章 相 关内 容 。 

e Query Degree: SMP 环境 下 处 理 查 询 的 并 行 度 ， 默 认 情 况 下 ，DB2 根据 
MAX QUERYDEGREE 和 DFT DEGREE 计算 得 到 。 在 当前 会 话 中 设置 并 行 度 的 语句 
示例 为 : SET CURRENT DEGREE = '4'。 


2. SQL 语句 文本 

原始 SQL 语句 和 经 过 优化 后 的 SQL 语句 示例 如 下 所 示 ， 这 两 条 语句 在 语义 上 等 价 ， 从 优 
化 后 的 SQL 语句 中 ， 可 以 看 出 编译 器 做 了 哪些 重 写 。 这 个 例子 中 ， 只 是 将 between…'and 谓词 
转换 成 了 等 价 的 <= 和 >= 谓 词 。 


Original Statement: 

select (Su Ss. ens eee y) 

rrom tocas. store sales 

where ss sold date sk between 2451000 and 2451500 and ss customer sk = 1 
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Optimized Statement: 
SELECT Q3. $C0 
FROM 
(SELECT SUM (Q2 SS QUANTITY ) 
FROM 
(SELECT QL, SS QUANTITY 
FROM TEPCDS -STORE SALES AS Q1 
WHERE (Q1.SS CUSTOMER SK = 1) AND (Q1.SS SOLD DATE SK <= 2451500) AND 
(2451000 <= Q1.SS SOLD DATE SK)) AS O2) AS Q3 


3. 访问 计划 


如 下 所 示 ，db2exfmt 用 树 型 图 表示 访问 计划 ,包含 的 市 把 可 以 分 为 两 类 ; 操作 节 扣 和 对 象 
站点 ， 其 中 非 叶 节点 为 操作 市 点 ， 叶 子 节 点 为 对 象 节 点 。 操 作 点 描述 每 个 操作 的 具体 信息 ， 
从 上 到 下 依次 为 : 返回 的 行 数 、 操 作 符 名 称 、 编 号、 累计 的 成 本 和 LO 成本; 对象 节操 包 括 基 
本 表 、 索 引 、 临 时 表 和 表 函 数 等 。 


Access Plan: 


Total Cost: DM 


Query Degree: 1 


ROWS 
RETURN 
(^ 1 
COST 

I/O 

| 

1 
IEEE WC 
( 2) 
22.8277 

3 

| 
paio 
Tog; CDI 
( 3) 
22o 02065 


pd dep 
IXSCAN IDEE ERES CDS 
( . 4) STORE SALES 
15.2442 O1 

2 

| 
1e-07 

Iam gi P dps 

SIUE 

O1 
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/A 注意: 操作 符 的 成 本 
访问 计划 图 中 操作 符 的 成 本 是 累计 的 ， 是 该 操作 符 及 其 子 树 成 本 的 总 和 。 因此， 在 
分 析 访 问 计 划 时 ， 应 该 着 眼 于 成 本 增长 最 大 的 操作 符 。 


在 DB2 中 ， 操 作 符 及 其 主要 描述 如 表 9-1 所 示 。 


表 9-1 DB2 访问 计划 中 的 主要 操作 符 
操作 符 描述 
RETURN 在 访问 计划 图 顶部 ， 用 于 返回 数据 
TBSCAN 表 扫 指 ， 扫 朱 基 本 表 或 者 系统 临时 表 中 的 每 一 行 数 据 
IXSCAN 索引 扫描 ， 根 据 谓词 搜索 索引 树 ， 得 到 满足 条 件 的 行 标示 符 列 表 〈RID 列表 ) 


FETCH 提取 ， 根 据 索引 扫描 得 到 的 RID 列表 ， 再 从 基本 表 中 读 取 它们 
FILTER 过 滤器 ， 复 杂 谓 词 (Residual Predicate) 计算 

SORT 排序 ， 按 某 些 列 的 值 对 数据 行进 行 排 序 ， 或 者 对 RID 列表 排序 
RIDSCAN 扫描 RID 列表 ， 从 排序 的 RID 列表 中 读 取 RID， 用 于 列表 预 取 
IXAND 索引 AND 操作 

NLJOIN CERT XE P 

HSJOIN 哈 大 连接 

MSJOIN 归并 连接 

GROUPBY | 分 组 与 聚集 

TQ 表 队 列 ， 用 于 DPF 或 MPP 环境 下 在 不 同 的 节点 间 交 换 数 据 ， 有 LTQ. BTQ. DTQ 等 
SHIP 用 于 数据 联邦 

INSERT 插入 操作 

UPDATE 更 新 操作 

DELETE 删除 操作 


访问 计划 图 后 面 紧 接 独 是 每 个 操作 符 的 详细 信息 ， 包 括 操作 人 符 的 成 本 明细 、 参 数 和 谓词 。 
需要 特别 注意 谓词 的 类 型 和 过 小 因子 , 请 参考 第 4 革 4.5.2 小 市 图 4-7 谓词 分 类 与 处 理 。 在 下 面 
的 示例 中 , 该 谓词 为 范围 定 界 (Range-Delimiting) ， 用 于 索引 扫描 ， 而 过 滤 因 子 为 2.39675e-06。 
在 9.2.5 小 证 ， 将 深入 分 析 谓 词 过 小 因子 和 基数 估计 的 原理 。 


4) IXSCAN: (Index Scan) 


Cumulative Total Costs 15.2442 
Cumularcivye CPU COST: 217565 
Cumulative 1/0 Cost: 2 

Cumulative Re-Total Cost: 0.107546 
Cumulative Re-CPU Cost: 188430 
Cumulative Re-I/O Cost: 0 

Cumulative First ROW osi: T. 62028 
Estimated Bufferpool Buffers: 4 
Arguments z 
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CUR ODE emere eme c 
TRUE 
DPESTFLG: (Number of data partitions accessed are Estimated) 


FALSE 

DPLSTPRT: (List of data partitions accessed) 
1 =2 

DPNUMPRT: (Number of data partitions accessed) 
2 


GLOBLOCK: (Global Lock intent) 
INTENT SHARE 
LCKAVOID: (Lock Avoidance) 
TRUE 
MAXPAGES: (Maximum pages for prefetch) 


2 

PREFETCH: (Type of Prefetch) 
NONE 

ROWLOCK : (Row Lock intent) 
SHARE (CS/RS) 

SCANDIR : (Scan Direction) 
FORWARD 

SKTE HS kI Inert Sor TOS) 
TRUE 

TABLOCK : (Table Lock intent) 


INTENT SHARE 
TBISOLVL: (Table access Isolation Level) 
(CIUBSOPmCSqABETETIS 


Predicates: 


2) Start Key Predicate, 
Comparison Operator: Equal (=) 
Subquery Input Required: No 
Filter Factor: 2.39675e-06 


Predicate Text: 


(Q1.SS CUSTOMER SK - 1) 


2) Stop Key Predicate, 
Comparison Operator: Equal (=) 
Subquery Input Required: No 
Filter Factor: 2.39675e-06 


Predicate Text: 


(Q1.SS CUSTOMER SK = 1) 


4. 访问 计划 中 用 到 的 表 和 索引 等 数据 库 对 象 


该 访问 计划 用 到 的 数据 库 对 象 为 表 TPCDS.STORE SALES 和 索引 SS CUST， 如 下 所 示 ， 
db2exfmt 打印 出 的 信息 还 包含 它们 的 基本 信息 和 统计 信息 。 
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Objects Used in Access Plan: 


和 RGDS 
STORE SALES 
Data Partrtroned Table 


Schema: 
Name: 
OCE 
Time of creation: 
Last statistics update: 
Number of columns: 
Number of rows: 


Width of rows: 


Number of buffer pool pages: 


Number of data partitions: 
Distinct row values: 

Tablespace name: 
Tablespace overhead: 
Tablespace transfer rate: 
Source for ESI cha SP GT 


Prefetch page count: 


Container extent page count: 


Table overtlow recor) count: 


Table Active BLOCKS- 


Average Row Compression Ratio: 


Percentage Rows Compressed: 


Average Compressed Row Size: 


RECHO 
o a 


Schema: 
Name: 
Type: Partitioned Index 

Time of creation: 


Last statistics update: 


2012=-07=28=-09.06.14,.407324 
2013=04-=-16=00. 00.00. 000000 


23 
10000000 
49 

35008 
8 
No 
<VARIOUS> 
7.500000 
0.060000 
Single Node 
32 
32 
0 
zl 
DUE ON 
98-6676 
56 


2012=10=13=23。44d. A40234940 
2013=-04-=-16=00. 00.00. 000000 


Number of columns: 1 

Number of rows: 10000000 
Width of rows: zi 

Number of buffer pool pages: 35006 
Distinct row values: No 
Tablespace name: <VARIOUS> 
Tablespace overhead: 7.500000 
Tablespace transfer rate: 0.060000 
Source for statisticss Single Node 
Prefetch page count: 32 
Container extent page count: 32 
Index clustering sStTacistics 93.000000 
Index leaf pages: A S2 

Index tree levels: 2 

Index full key cardinality: 413696 
Index first key cardinality: 413696 
Index first 2 keys cardinality: =1 
Index first 3 keys cardinality: =1 
Index first 4 keys cardinality: 二 外 
Index sequential pages: 269 
Index page density: 59 

Index avg sequential pages: 0 
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Index avg gap between sequences:0 


Index avg random pages: 0 

Fetch avg sequential pages: zl 

Fetch avg gap between sequences:-1 

Fetch avg random pages: zu 

Index RID count: 1425394 
Index deleted RID count: 0 

Index empty leaf pages: 0 

Base Table Schema: DS 

Base Table Names SORES 


外 LUDnnmS 工 而 E: 


USE 


9.2.3 ” 表 扫 拍 与 系 引 扫 摘 


当 优 化 器 生成 访问 计划 时 ， 有 两 个 最 基本 的 问题 ， 用 什么 样 的 方式 访问 表 中 的 数据 ; 用 什 
么 样 的 方式 和 顺序 处 理 表 之 间 的 连接 。 本 小 节 将 介绍 访问 表 的 方式 ，9.2.4 市 介绍 表 连 接 方 式 。 

访问 表 的 方式 称 为 “访问 路 径 ” (Access Pat) 。 访 问 路 径 分 索引 扫描 和 表 扫 描 。 一 般 来 
讲 ， 索 引 扫 描 比 表 扫 描 快 ， 但 也 并 不 绝对 。 具 体 来 襄 ， 有 如 下 儿 种 : 

e 表 扫 描 : TBSCAN; 

e 索引 扫描 : IXSCAN + FETCH; 

e 索引 列表 预 取 :， IXSCAN + List Prefetch; 

e 索引 与 操作 : IXSCAN + IXAND， 能 利用 多 个 索引 并 进行 “与 操作 ” ; 

e 索引 或 操作 : IXSCAN + SORT +RIDSCAN， 能 利用 多 个 索引 并 进行 “或 操作 ”。 


A 注意 : 索引 或 操作 没有 显 式 的 IXOR 操作 : 
索引 “或 操作 ”没有 显 式 的 IXOR 操作 符 ， 实 际 上 是 将 索引 扫描 后 的 各 个 RID 列表 
排序 ， 然 后 用 RIDSCAN 操作 对 这 些 有 序 的 RID 列表 进行 归并 扫描 ， 从 而 实现 索引 “或 
操作 ”。 


在 本 书 第 4 章 4.5 中 已 经 讲 过 表 扫 描 和 有 款 引 扫 描 ， 这 一 节 将 重点 讲解 乏 引 列表 了 预 取 、 索 
g| ^ 5 eTE" MRI, RERE” . 
1. 索引 列表 预 取 


索引 扫描 有 一 种 方式 称 为 List Prefetch, 先 通过 索引 扫描 得 到 满足 谓词 条 件 的 所 有 RID, 95 
后 将 这 些 RID 进行 排序 ， 再 用 它们 访问 数据 页 。 这 样 可 以 对 相 邻 的 数据 行进 行 连续 的 访问 ， 从 
而 通过 预 取 减少 IO 次 数 。 与 随机 VO 相 比 ， 这 种 方式 的 开销 要 小 得 多 ， 因 为 如 果 绥 冲 池 没 法 
放下 所 有 的 页 ， 随 机 访问 可 能 导致 一 个 页 面 从 人 磁盘 中 读 入 多 次 。 

下 面 是 List Prefetch 的 例子 : 访问 计划 中 的 SORT 操作 用 于 将 索引 扫 朱 得 出 的 RID 进行 排 
序 ， 然 后 再 用 预 取 的 方式 谈 取 基本 表 的 数据 。 预 取 能 够 减少 磁盘 UO 次 数 ， 从 而 提高 数据 访问 
的 性 能 。 
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295199 
FETCH 
(o 3 
308-619 
61,2878 


25548865 15009 
RIDSCN TABLE: TPCD 
( 10) L SUMMARY2 
219.093 
17.4697 
| 
| 
45:5 - 895 
SORT 
IET) 
219.091 
17.4697 
| 
253.985 
IXSCAN 
(or EZ 
Pubs museo 
17.4697 
| 
15009 
INDEX: TPCD 
L SUMMARY2 IDX 


2. 索引 与 操作 
当 SQL 语句 在 同一 个 表 上 有 多 个 谓词 ， 并 可 以 使 用 多 个 索引 扫描 时 ，DB2 使 用 IXAND 操 


作 符 来 执行 索引 与 〈Index Anding) 操作 。 款 引 与 操作 将 多 个 索引 得 到 的 RID 列表 合并 ， 只 取 


共同 存在 的 RID. 


例如 ，LINEITEM 表 上 有 两 个 索引 : orderkey 列 上 的 L OK M prod key 列 上 的 L PD。 下 


面 这 条 查询 在 order key 上 的 谓词 可 以 使 用 索引 L OK. 在 prod key 上 的 谓词 可 以 使 用 索引 
L PD. 


SELECT sum (quantity) 


FROM WE OD TESTES DET AE 
WHERE order key in (103982, 1039473, 1039294) 
AND proc _ key = 498239; 


相应 的 访问 计划 如 下 所 示 ，IXAND 节点 将 两 个 IXSCAN 连接 起 来 ， 而 在 IXAND 上 采取 了 


LIST PREFETCH. 
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1952.4 
/----+---\ 
306.261 1.50002e+08 
RIDSCN JA SER S ESI 
( 4) LINEITEM 
4027.9 
1100.96 
| 
006-261 
SORA 
(5) 
4027.9 
1100.96 
| 
886.281 
IXAND 
( 6) 
40Q026.01 
1100.96 
/------ +----- \ 
24e 152 Ducis 
IXSCAN IXSCAN 
(m ( 8) 
1480,95 2509.07 
450,024 670.935 


1., 50002e+06 


INDEX: TPCD 
E Or 


3. 索引 或 操作 


| 
1.50002e408 
INDEX: TPCD 
lo (EID 


如 果 SQL 语句 中 的 多 个 谓词 是 “或 (ORO ”组合 在 一 起 ， 并 同时 可 以 使 用 多 个 索引 。 这 
时 ，DB2 通过 Index Oring 操作 ,将 多 个 索引 扫描 得 到 的 RID 进行 合并 ， 并 将 重复 的 RID 去 挥 。 


与 Index Anding 操作 不 同 ， 索 引 “ 或 操作 ”在 访问 计划 中 没有 显 式 的 操作 符 〈 比 如 IOR) 。 
使 用 索引 “或 ”的 访问 计划 示例 如 下 ， 它 同时 使 用 了 三 个 索引 扫描 ， 并 且 对 每 个 索引 扫描 
得 到 的 RID 进行 排序 , 然后 对 三 个 RID 列表 上 直接 做 RIDSCAN 进行 RID 的 合并 操作 , 最 后 从 


基本 表 上 提取 数据 。 
| 
59537.2 
FETCH 
Co 3) 
62819.1 
37361.7 
C 
59537.2  1.50002e+08 
RIDSCN dC AHED 
( 4) LINEITEM 
803.781 
82.2908 
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十 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 十 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 + 
956303 150.002 4.00006 
SORT SORT SORT 
1 oa (o 3) Tooo 
533.127 735-5554 p EY 
1.2908 3 E 

| | | 
593983-3 150.002 4.00006 
IXSCAN IXSCAN IXSCAN 
o 3) (o 0$ (E92) 
So 00.8 Jd sro dU y SU 
1.2908 3 3 
| | | 
1.50002e408 1.50002e-08 1.50002e+08 
INDEX: INDEX: INDEX: 
TECO EE D TPCD.L SK PK Ee 


9.2.4 ” 髓 套 循环 连接 、 归 并 连接 和 蛤 希 连 接 


如 果 需 要 连接 两 个 以 上 的 表 ， 优 化 需 每 次 也 最 多 只 能 连接 两 个 表 ， 并 保存 中 间 结 来 ， 再 与 
其 他 表 做 两 两 连接 。 优 化 器 在 考虑 两 个 表 的 连接 操作 上 时， 主要 考虑 三 种 连接 方法 KETE 
接 、 归 并 连接 和 哈 希 连接 。 本 节 主 要 讨论 这 三 种 连接 方法 。 


会 注意 : 星 型 连接 
对 于 用 星 型 模型 建 模 的 OLAP 应 用 ，DB2 可 为 复杂 查询 生成 星 型 连接 的 访问 计划 ， 
这 样 可 以 一 次 性 连接 多 个 表 。DB2 中 支持 三 种 星 型 连接 : 

€ Cartesian Hub: 维度 表 之 间 先 做 笠 卡 尔 连接 ， 然 后 再 和 事实 表 做 连接 。 

€ Dynamic Index Anding: 每 个 维度 表 通 过 事实 表 上 的 索引 与 事实 表 进 行 半 连接 操 
作 ， 得 到 事实 表 中 满足 各 连接 谓词 的 RID 列表 ， 然 后 用 动态 位 图 进行 索引 与 操 
作 ， 然 后 从 事实 表 中 提取 数据 ， 最 后 再 与 维度 表 做 连接 。 

€ Zigzag Join: DB2 VIO 提供 的 新 技术 ， 维 度 表 通过 事实 表 中 的 多 列 索 引 一 次 性 完 
成 多 表 的 星 型 连接 操作 。 


A 注 意 : 外 表 和 内 表 T 
对 于 两 两 连接 方法 ， 连 接 的 两 个 表 一 个 为 外 表 (outer table); 另 一 个 为 内 表 (inner 
table )。 外 表 也 称 为 驱动 表 ， 处 理 连 接 时 ,对 于 外 表 的 每 一 行 ， 都 会 去 内 表 中 查找 是 否 有 
相应 的 匹配 行 
优化 器 根据 所 选 连接 方法 的 类 型 和 成 本 决定 哪个 是 外 表 、 哪 个 是 内 表 。 


这 三 种 连接 方法 的 访问 计划 示意 网 如 网 9-4 所 未 ， 各 有 特点 : 

e KEMMER: 两 层 循环 处 理 连接 ， 适 用 于 内 表 较 小 或 者 内 表 上 可 以 使 用 索引 扫 拉 的 
场景 。 

e 归并 连接 : 内 表 和 外 表 都 需要 有 序 ， 这 可 以 用 显 陈 的 SORT 来 保证 ， 也 可 以 是 索引 中 
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本 来 就 是 有 序 的 数据 。 归 并 连接 的 谓词 只 能 是 等 于 谓词 。 
e 哈 希 连接 : 内 表 一 般 较 小 ， 用 内 表 构 建 喻 希 表 。 对 于 外 表 的 每 一 行 ， 在 这 个 哈 希 表 中 
进行 快速 得 找 。 哈 而 连接 的 谓词 也 只 能 是 等 于 谓词 。 


图 9-4 三 种 连接 的 访问 计划 示意 图 


1. REMEI 


人 循环 馈 套 连接 的 运行 方式 如 图 9-5 所 示 。 外 表 只 扫描 一 次 ， 而 针对 外 表 中 的 每 一 行 ， 必 要 
扫描 一 次 内 表 ， 碍 找 是 否 有 匹配 的 行 。 


DESCRIPTION JOB_ID 
"interpreter a 


-.. [Medical Technologist | 5 | 


JOB ID [FIRSTNAME | | 


OUTER TABLE 


图 9-5 A44 


KEMMER SPARTA ggf. ARARA 9 mE: 

(1) 对 内 表 全 扫描 : 即 恋 取 内 表 中 的 每 一 行 ， 与 外 表 中 的 当前 行进 行 匹配 ， 这 适合 于 内 
表 较 小 的 情形 。 

(20 o WR SEHE: 当 连 接 的 谓词 可 以 使 用 内 表 的 索引 时 ， 外 表 的 每 一 个 值 都 能 在 内 
表 的 索引 上 找到 。 这 也 是 骸 套 循环 连接 最 常见 的 形式 。 

下 面 是 租 套 循环 连接 的 例子 ， 其 中 TELLER 是 外 表 ，HISTORY 是 内 表 。 从 访问 计划 中 可 
以 看 出 ， 内 表 HISTORY 使 用 了 索引 扫描 ， 对 于 外 表 TELLER 的 每 一 行 ， 都 会 对 内 表 进 行 一 次 
索引 扫描 。 

SELECT HISTORY BRANCH ID, TELLER TELLER NAME 7 


HISTORY.ACCTNAME, 
HISTORY- ACCT ID, HISTORY BALANCE 
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ESESDMISENIEE S ONE YE ORS 
HAERE MISTORY TELLER ID = TELLER. TELLER ID AND HISTORY BRANCH ID = 25 
ORDER BY HMISTORY BRANCH ID ASC, MISTORY. ACCT ID ASC 5 


TJA SZ 
TBSCAN 
(2) 
3821-09 
S317.376 
| 
uod n 
SORAN 
(3) 
3827 02 
GUESS 
| 
923. 52 
NLJOIN 
(4) 
3826.48 
SUMI NES 
/[---------- £--------- Y 
4: 9/1910, 0.79452 
PETCH FETCH 
(5) (m 
159.046 23.0878 
33 E TOASA 
/---+---\ /---+---\ 
1000 1000 O. 79452 79452 
IXSCAN TABLE: ADMIN IXSCAN TABLE: ADMIN 
( 6) Josse n ( 8) HLSTORY 
52.0664d 12.8738 
4 ll 
| | 
1000 79452 
INDEX: ADMIN INDEX: ADMIN 
ANDAA HISTIXI 


G dEEG REENER TEER ————| 
对 于 不 等 谓词 ( 即 >、<、>=、<= 和 l=) Hi, RAEM RARA., xp 
两 个 表 的 笛 卡 尔 积 ( 即 没有 连接 谓词 ), 也 只 能 使 用 诅 套 循环 连接 , 如 SELECT * FROM 
JI 


2. 归并 连接 


归并 连接 的 谓词 必须 是 等 于 谓词 ( 即 具 有 tablel.column = table2.colum 形式 ) ， 并 且 还 要 
求 根 据 连 接 列 对 两 个 表 进 行 排序 。 

归并 连接 的 运行 方式 如 图 9-6 所 和 示 。 由 于 外 表 和 内 表 都 是 有 序 的 ， 所 以 外 表 和 内 表 都 只 扫 
摘 一 次 。 
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DESCRIPTION OB ID 
。 ComputerAnalyst| 1 | —— 


L.|Biotechnian | 4^ |— [| 4 [poem —— 
[Medica Techno. | 5 | 一 一 -一 一 | 5 [Debbie —— 


JOB_ID |FIRSTNAME | —— 


| 8 [Debe | 
.-- If Duplicate Join Value 1 8 j | 8  |Tad | 


图 9-6 归并 连接 


归并 连接 的 访问 计划 示例 如 下 所 示 ， 和 髋 套 循 环 连接 一 样 ，TELLER 是 外 表 ，HISTORY 
是 内 表 。 可 以 发 现 外 表 TELLER 通过 IXSCAN (索引 数据 本 来 就 是 有 序 的 ) 来 保证 连接 字段 有 
FF; WX HISTORY 有 个 显 式 SORT 操作 从 而 保证 连接 字段 有 序 。 


SELECT HISTORY BRANCH ID, TELLER TELLER NAME 7 
HISTORY.ACCTNAME, 
HISTORY- ACCT ID, HISTORY BALANCE 
ONE ES OR 
HAERE MISTORY TELLER ID = TELLER TELLER ID AND HISTORY BRANCH ID = 25 
ORDER BY HMISTORY BRANCH ID ASC, MISTORY ACCT ID ASC 5 


794.52 
MSJOIN 
ooo 
S530571 
OUS 
jeu 一 一 一 一 一 \ 
1000 0.79452 
FETCH FILTER 
( 3) ( 03) 
159.046 oq S 
33 342 
[wm = | 
1000 1000 794.52 
IXSCAN TABLE: ADMIN TBSCAN 
( 6) TREES ( 8) 
5 00064 OTI oS 
4 34 
| | 
1000 T94.52 
INDEX: ADMIN SORT 
TELLINDX ( 9) 
671.229 
342 
| 
pod sp 
TBSCAN 
C390) 
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TORE 
342 
| 
79452 
TABLE: ADMIN 
HLSTORY 


3. 了 哈 希 连接 


哈 希 连接 只 能 处 理 一 个 或 多 个 等 于 连接 谓词 ， 并 要 求 连接 谓词 两 端的 字段 类 型 相同 ， 且 不 
能 含有 表达 式 Wi CHAR 类 型 而 言 ， 长 度 必须 相同 ; 加 DECIMAL 类 型 而 言 ， 精 度 和 小 数位 必 
须 相 同 。 


Aa 注意 :DB2 V10 对 哈 希 连接 的 增强 
DB2 V10 增强 了 哈 布 连接 的 能 力 ， 能 将 含有 表达 式 或 者 字段 类 型 不 匹配 的 连接 谓词 
作为 哈 希 连接 的 连接 谓词 ， 比 如 T1.C1 = T2.C2+1， 或 者 Tl.C1 INT = T2.C2 DECIMAL 
等 。 不 过 ， 从 性 能 上 考虑 ， 应 该 避免 使 用 复杂 表达 式 或 者 类 型 不 匹配 的 连接 谓词 。 


哈 希 连接 的 运行 方式 如 图 9-7 所 示 ， 分 为 两 个 阶段 : 

CI) 构建 哈 希 表 (build table) : 首先 扫描 内 表 ， 根 据 连接 谓词 的 字段 计 算 哈 希 键 (hash key) ， 
构建 一 个 哈 希 表 〔 这 个 阶段 称 为 构建 表 ，build table) 。 哈 希 表 被 分 为 几 个 分 区 ， 如 果 内 存 中 没 
有 足够 的 空间 容纳 整个 表 ， 则 有 些 分 区 将 被 写 入 磁盘 上 的 临时 表 。 

(2) 探测 表 Cprobetable) : 扫 摘 外 表 ， 对 于 外 表 的 每 一 行 ， 对 连接 列 应 用 同一 哈 希 算法 
计算 哈 希 键 ， 然 后 根据 哈 希 键 在 哈 希 表 中 查找 内 表 的 匹配 记录 。 如 果 哈 希 键 对 应 的 哈 希 表 分 区 
在 内 存 中 ， 则 立即 返回 匹配 连接 的 结果 。 如 果 该 分 区 被 写 入 到 磁盘 上 的 临时 表 中 ， 则 外 表 的 行 
也 被 写 入 临时 表 。 
pescmemom | oa 
-es | 二 
ee | | etc. 


... [Medical Technologist TET 
| —IL:— 
7 


Computer Analyst Can 


JOB_ID FIRSTNAME me 


图 9-7 哈 希 连接 


4 注意 : 哈 希 连接 使 用 的 内 存 池 为 SORTHEAP 
哈 希 连接 构建 哈 希 表 时 使 用 的 内 存 池 为 SORTHEAP, 如 果 SORTHEAP 的 内 存 不 够 ， 
W2uxhmpmERSZ b. REGERE UO 溢出 。 因 此 ， 为 了 提高 哈 硕 连接 的 性 能 ， 避 免 IO X 


出 ， 应 该 适当 调整 SORTHEAP 的 大 小 。 
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不 同 于 蔡 套 循环 连接 和 归并 连接 ，HISTORY 是 外 表 ，TELLER 是 内 表 ， 用 于 构建 哈 希 表 。 
哈 希 连接 的 访问 计划 示例 如 下 所 示 : 


SELECT HISTORY BRANCH ID, TELLER TELLER NAME 
HISTORY.ACCTNAME, 
HISTORY. ACCT ID, HISTORY BALANCE 
ELEM SEDE S OE YE S ESOR S E 
HAERE MISTORY TELLER ID = TELLER TELLER ID AND HISTORY BRANCH ID = 25 
ORDER BY HMISTORY BRANCH ID ASC, MISTORY. ACCT ID ASC 5 


uod» 
HSJOIN 
( 4) 
722.496 
336.17 
/---------- +--------- \ 
T94 -52 1000 
PETCH PETC 
0 5 ( 9) 
563. 302 159.046 
ES 33 
/---+---\ /---+---\ 
794. 352 T9452 1000 1000 
RIED re UN TABLE: ADMIN IXSCAN TABLE: ADMIN 
( 6) ESQ S ( — T05 TELLER 
13.60568 52.0664 
1 4 
| | 
794,52 1000 
SORIB INDEX: ADMIN 
( 7) TELLINDX 
13.60533 
1 
| 
poU 
IXSCAN 
( 8) 
13.3792 
1 
| 
79452 
INDEX: ADMIN 
HLILSTIXI 


9.2.5 ”基数 估计 和 统计 信息 


访问 计划 中 每 个 操作 符 上 有 3 个 关键 的 数字 : 基数、 成 本 和 UO 成 本 。 在 9.1 节 中 ， 我 们 
己 经 了 解 优 化 器 基于 成 本 来 评估 候选 的 访问 计划 。 基 数 佑 计 是 成 本 评估 的 关键 ， 而 优化 器 依赖 
于 准确 的 统计 信息 来 进行 基数 估计 。 本 市 将 深入 讨论 这 个 问题 。 

优化 器 在 基数 估计 和 成 本 评估 的 过 程 中 ， 有 3 个 度量 标准 : 

e Cost (成 本 ) : 成 本 表现 为 CPU、VO 和 通信 等 所 需要 的 开销 ， 成 本 的 单位 为 timerons， 
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这 是 一 个 人 千 的 单位 ， 不 能 解释 为 实际 时 间 单 位 。 

e Cardinality (基数 ) : 返回 数据 集 的 行 数 。 对 于 访问 计划 中 的 每 个 操作 符 ， 优 化 右 根 据 
输入 数据 集 的 行 数 和 操作 符 上 的 谓词 (或 者 聚集 操作 ) 估计 输出 数据 集 的 行 数 。 

e Filter Factor CHEJEDS-T , WWA f£ : 表示 数据 集 满足 谓词 条 件 的 比率 ， 它 的 值 介 于 
0-1 之 间 ，0 表示 没有 数据 行 满足 谓词 条 件 。 在 访问 计划 操作 符 的 详细 信息 中 ， 每 个 谓 
词 都 有 一 个 Filter Factor. 


JN 注意 : 过 滤 因 子 vs 选择 度 
过 滤 因 子 的 另 一 种 说 法 为 选择 度 (selectivity)， 谓 词 的 选择 度 高 对 应 过 滤 因 子 的 值 
较 小 ， 谓 词 的 选择 度 低 对 应 过 滤 因 子 的 值 较 大 。 


优化 器 正 是 凭借 基数 估计 〈Cardinality Estimation) 来 计算 每 个 操作 符 的 成 本 以 及 整个 查询 
的 成 本 。 要 想 基 数 估 计 精 确 ， 束 需要 有 准确 的 统计 信息 ， 从 这 个 角度 上 说 ， 统 计 信 息 是 优化 此 
的 “导航 仪 ”。 

DB2 中 的 统计 信息 主要 包括 以 下 内 容 : 

e 基本 统计 信息 : 包括 表 、 列 和 索引 的 统计 信息 。 

e 分 布 统计 信息 : 频率 (frequency) 统计 信息 和 分 位 数 Cquantile) 统计 信息 。 

e 列 组 统计 信息 : 计算 具有 相关 性 的 列 组 (column group). 统计 信息 ， 为 联合 谓词 的 过 滤 

因子 提供 更 精确 的 估计 。 
本 市 将 介绍 各 种 统计 信息 ， 并 讨论 优化 器 如 何 利 用 这 些 统计 信 息 进行 基数 估计 。 
1. 如 何 查 看 现 有 的 统计 信息 


首先 讲解 如 何 租 看 现 有 统计 信息 。 
(1) 直接 查询 syscat 或 sysstat 模式 下 的 视图 
相关 视图 如 表 9-2 所 示 。 包 括 syscat 视图 和 sysstat 视图 。 实 际 上 ，sysstat 视图 正 是 基于 相 
应 的 syscat 视图 而 定义 的 。 


表 9-2 ”统计 信息 视图 
统计 信息 sysstat 视 
表 的 统计 信息 TABLES 
列 的 基本 统计 信息 COLUMNS 
索引 的 统计 信息 INDEXES 
列 的 分 布 统计 信息 COLDIST 
列 组 统计 信息 COLGROUPS 


(2) 解释 SQL 语句 时 使 用 snapshot 选项 
在 解释 SQL 语句 时 使 用 snapshot 选项 ， 这样 DB2 将 编译 SQL 语句 时 使 用 的 统计 信息 也 包 
含 在 访问 计划 的 输出 中 ， 这 样 大 大 方便 了 对 访问 计划 的 分 析 。 


db2 explain plan with snapshot for select ...; 
cdloz2exfmt =e <dio name> =1 =0 <outputitile> 


354 


$93 SQL 语句 优化 实战 


或 者 

db2 set current explain mode explain 

db2 set current explain snapshot explain 
select sca 

db2 set current explain mode no 

db2 set current explain snapshot no 

clo esu. Or «0us dade cub 9 onte 


(3) 使 用 db2cat 工具 打印 出 相关 表 的 统计 信和 县 
使 用 db2cat 的 命令 示例 如 下 ， 其 中 ，-d 选项 指定 数据 库 ，-s 选项 指定 模式 ，-n 选项 指定 表 
名 ，-0 选项 指定 输出 文件 : 


Cloz2cat =e tpecds =s TPCDS =n store sales -0 store sales.cat 


(4) 使 用 db2look 工具 导出 相关 表 的 统计 信息 
使 用 db21ook 的 命令 示例 如 下 ， 其 中 ，-d 选项 指定 数据 库 ，-z 选项 指定 模式 ，-t 选项 指定 
表 名 ，-m 表示 导出 统计 信息 ，-o 选项 指定 输出 文件 。db2look 的 输出 中 用 update 语句 的 形式 显 
示 了 相应 的 统计 信息 。 


cloz GOKR eges =z TPCDS =E store sales -m =0 store sales.cat 


2. 基本 统计 信息 与 基数 估计 


接 下 来 ， 介 绍 基本 统计 信息 以 及 优化 器 如 何 使 用 这 些 统计 信息 进行 基数 估计 。 
d) 表 的 基本 统计 信息 

表 的 基本 统计 信息 主要 有 : 

e CARD: 表 中 的 行 数 ( 基 数 ) 。 

e FPAGES: 当前 使 用 的 页 面 数 。 

e NPAGES: 包含 记录 行 的 页 面 数 。 

e OVERFLOW: 溢出 的 行 数 。 

e AVGROWSIZE: 行 的 平均 长 度 。 

e ACTIVE BLOCKS: 表示 MDC 包含 数据 的 块 数 。 

表 的 统计 信息 可 以 从 视图 syscattables 或 者 sysstattables 中 查 到 。 如 下 所 示 ， 表 
TPCDS.STORE SALES 的 行 数 为 10000000， 占 用 存储 为 35008 页 (FPAGES) ， 实 际 存储 数据 
行 的 页 NPAGES 为 34976， 行 的 平均 长 度 AVGROWSIZE 为 56 字 节 。 


select CARD,  NPAGES, FPAGES,  AVGROWSIZE,OVERFLOW from  sysstat.tables where 
doge HDI TPCDS" and TABNAME=" STORE SALES 


CARD NPAGES FPAGES AVGROWSIZE OVERFLOW 


FNETHEEDEDICESNERE 


当 表 统计 信息 中 的 FPAGES 与 NPAGES 相差 加 大 ， 或 者 OVERFLOW 的 值 较 大 时 ， 
说 明 表 的 存储 碎片 较 多 ， 就 应 该 运行 REORGCHK 或 REORG 重组 表 ， 然 后 RUNSTATS 
更 新 统计 信息 。 
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(2) 列 的 基本 统计 信息 

列 的 基本 统计 信息 主要 有 : 

e COLCARD: 列 上 不 同 值 的 数目 。 

e NUMNULLS: 列 上 衬 值 数据 。 

e HIGH2KEY: 列 上 的 第 二 大 值 。 

e LOW2KEY: 列 上 的 第 二 小 值 。 

列 的 统计 信息 可 以 从 视图 syscat.columns 或 者 sysstatcolumns 中 查 到 。 如 下 所 示 ， 表 
STORE SALES 中 字段 SS EXT SALES PRICE 上 不 同 值 (COLCARD) 的 数目 为 292， 空 值 数 
据 为 0， 而 第 二 大 值 (HIGH2KEY) 为 990.00， 第 二 小 值 (LOW2KEY) 为 4.00。 


select COLCARD, NUMNULLS, HIGH2KEY, LOW2KEY from Sysstat Columns where 
TABSCHEMA='TPCDS' and TABNAME=" STORE GALES" and COLNAMES=" $9 BXT SALES PRICHE" 


COLCARD NUMNULLS HIGH2 KEY LOW2KEY 


为 什么 DB2 不 统计 列 上 的 最 大 最 小 值 ， 退 而 求 其 次 , 统计 第 二 大 和 第 二 小 的 值 呢 ? 
因为 这 样 可 以 避免 一 些 异 常数 据 这 来 的 误差 。 实践 证 明 , 使 用 HIGH2KEY 和 LOW2KEY 
来 估计 基数 效果 更 好 。 


(3) 索引 的 基本 统计 信息 
索引 的 基本 统计 信息 主要 有 : 
e NLEAF: 叶子 节点 的 由 面 数 。 
e NLEVELS: 索引 的 层级 。 
e INDCARD: 索引 项 的 数目 ， 这 个 数目 与 表 的 基数 可 能 不 同 ， 因 为 索引 项 与 数据 行 并 不 
是 一 一 对 应 的 关系 。 
e FIRSTKEYCARD: 组 合 索引 上 第 一 个 列 的 不 同 值 数 目 。 
e FIRST2KEYCARD/FIRST3KEYCARD/FIRSTAKEYCARD: 组 合 索 引 中 前 2、3、4 个 列 
的 基数 ， 当 这 些 项 不 适用 于 该 索引 时 《比如 单 键 索引 ) ， 值 为 一 1。 
e FULLKEYCARD: 索引 全 部 列 的 不 同 值 的 数目 。 
索引 的 统计 信息 可 以 从 视图 syscat.indexes 或 者 sysstat.indexes HÆS). W Pr. RII 
C SALESDATE 是 定义 在 表 STORE SALES 上 的 字段 SS SOLD DATE SK 的 单 键 索引 ， 叶 子 
页 面 数 为 267， 而 索引 的 层级 为 2， 共 有 3651 个 不 同 的 索引 键 值 ， 索 引 项 为 1425394. 


select NLEAF, NDEVELS; JE ge] e m EOAR INDCARD from  sysstat.indexes where 
TABSCHEMA=" TPCDS" and) TABNAME=" STORE SALES" anc INDNAME=" S9 SOLDDATE 


NLEAF NLEVELS FIRSTKEYCARD INDCARD 


267 2 1824 1425394 
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A 注意 : 索引 的 其 他 统计 信息 ig 
索引 上 还 有 其 他 的 统计 信息 , 比如 SEQUENTIAL PAGES. DENSITY. CLUSTERRATIO. 
CLUSTERFACTOR 年 ,这些 统计 信息 对 于 估计 索引 扫描 所 需 VO 成 本 时 非常 重要 ， 


值 不 理想 时 也 能 作为 是 否 需 要 REORG 的 依据 。 


(4) 基于 基本 统计 信息 的 基数 估计 

只 有 基本 统计 信息 的 情况 下 ，DB2 优化 器 认为 所 有 的 数据 都 是 均匀 分 布 的 。 优 化 器 对 下 面 
三 类 谓词 的 过 滤 因 子 计 算 公 式 如 下 所 示 : 

e 局 部 等 于 谓词 (如 Cl=7) : 


fE = 1/colcard (C1) 


e 范围 谓词 (如 keyl < C1 <= key2) : 


= 


连接 谓词 (如 C1=C2) : 


使 全 三 1 /有 又 (colcard ee ea 


对 于 单个 表 T 上 的 请 词 条 件 ， 相 应 的 基数 计算 公式 为 : 


Carel (M) = FE 


对 于 两 个 表 Tl 和 T2 上 的 连接 谓词 ， 相 应 的 基数 计算 公式 为 : 


carci (Tl) Ee ccu) EE hu 


例如 ， 对 于 查询 select count(*)from TPCDS.STORE SALES where SS EXT SALES PRICE 
= $0.00， 根 据 表 的 基本 统计 信息 ， 得 到 card(STORE SALES)=10000000, 而 根据 列 的 统计 信息 ， 
得 到 colcard (SS EXT SALES PRICE) =292， 于 是 谓词 SS EXT SALES PRICE = 50.00 的 过 
滤 因 子 ff-l/coleard (SS EXT SALES PRICE) =1/292 守 0.00315426， 于 是 基数 估计 为 card 

(STORE SALES) Xff ~ 10000000 X0.00315426 = 31542.6. 

而 对 于 范围 谓词 ， 例 如 SELECT count (*) FROM TPCDS.STORE SALES WHERE 
SS EXT SALES PRICE > 50.00 and SS EXT SALES PRICE <=150.00, 谓词 的 过 滤 因 子 按照 公 
式 为 f Ckey2-keyl) / (high2key-low2key) = (150.00-50.00) / (990.00-4.00) 4:0.10141988, 
其 中 990.00 和 4.00 分 别 为 列 SS EXT SALES PRICE 的 high2key 和 low2key。 于 是 基数 估计 为 
card X ff^«10000000 X 0.10141988-1014129.88. 


A 注意 : 基本 统计 信息 的 收集 | 
在 表 或 者 索引 上 运行 RUNSTATS 命令 就 可 以 收集 基本 的 统计 信息 ， 比 如 ， 
RUNSTATS ON TABLE TPCDS.STORE SALES AND INDEXES ALL. 详情 请 参考 本 书 第 


7 cum 


3. 分 布 统计 信息 
如 前 所 述 ， 在 只 有 基本 统计 信息 的 情况 下 ，DB2 优化 器 认为 所 有 的 数据 都 是 均匀 分 布 的 。 
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但 这 与 实际 的 情况 可 能 不 一 致 ， 比 如 ， 列 上 茶 个 值 的 数目 比较 多 或 者 茶 区 间 上 的 数据 比较 多 ， 
使 用 均匀 分 布 进行 基数 估计 就 不 准确 了 。 

例如 ， 尺 SS EXT SALES PRICE 的 值 苑 围 〈 销 售 价 格 区 间 ) 为 4.00 一 990.00， 但 是 大 
部 分 的 销售 价格 小 于 200.00。 如 前 面 的 分 析 ， 对 于 下 面 的 得 询 ， 优 化 器 利用 基本 统计 信息 佑 计 
的 基数 为 1014129.88， 实 际 的 得 询 结束 则 为 3618913, W FAR, FERNI: 


SELECT count(*) FROM TPCDS.STORE SALES WHERE SS EXT SALES PRICE > 50.00 
So Ce 0 010 


and 


3616913 


1 record(s) selected. 


因此 ， 当 表 中 存储 了 很 多 重复 值 ， 或 者 数据 在 表 中 并 非 均 匀 分 布 的 时 候 ， 就 需要 利用 分 布 
统计 信息 对 基数 估计 进行 修正 。 
DB2 提供 了 两 种 分 布 统计 信息 : 频率 (frequency) 统计 信息 和 分 位 数 (quantile) 统计 信息 。 
A 注 意 : 分 布 统计 信息 的 收集 
可 以 使 用 WITH DISTRIBUTION 选项 执行 RUNSTATS 命令 , 来 收集 分 布 统计 信息 ， 
例如 ，RUNSTATS ON TABLE TPCDS.STORE SALES WITH DISTRIBUTION， 收 集 所 有 
列 的 d 统计 信息 。 
集 分 布 统计 信息 要 比 收集 基本 统计 信息 开销 更 大 ， 对 于 值 分 布 均匀 的 列 ， 不 必 收 
Rr 息 。RUNSTATS 命令 能 指定 只 对 某 些 列 收集 分 布 统计 信息 。 
外 ,RUNSTATS 命令 也 能 使 用 NUM FREQVALUES( 频率 ) 和 NUM QUANTILES 


位 数 ) 选项 来 定制 分 布 统计 信息 的 数量 ， 默 认 情 况 下 ，DB2 收集 10 个 频率 值 ，20 
mE 


2 P 


(1 ) 频率 统计 信息 
频率 统计 信息 记录 出 现 频率 最 高 的 几 个 值 以 及 出 现 次 数 。 例 如 ，EMPLOYEE 表 上 列 JOB 
的 频率 统计 信息 如 下 所 示 : 


JOB COUNT ( JOB) 
DESIGNER 10 
C LIBIRIK 8 
MANAGER 7 
OPERATOR 6 
E LE ILIDIRKE P 5 
ANALYST 3 
SALESREP 2 
BREIS 1 


对 于 查询 select count (*) from EMPLOYEE where job = “DESIGNER”， 如 果 使 用 基本 
统计 信息 , 表 的 基数 为 42, 列 Job 的 基数 为 8, 则 基数 估计 为 card X 1/colcard(job) = 42/8=5.25。 
如 果 使 用 频率 统计 信息 ， 则 能 精确 地 得 到 基数 为 10。 
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(2) 分 位 数 统计 信息 
分 位 数 统计 信息 实际 上 束 是 统计 数据 的 区 间 分 布 ， 即 柱状 图 。 例 如 ， 列 Cl 包含 下 和 面 的 值 ， 
其 数据 分 布 区 间 并 不 是 均匀 的 : 


uo» O0 (O9 O09 ~ Oy Oy €» 


«o 
C2 


O 
1 
E 
1 
2 
.4 
5 
1 
6 
5.10. 


100 


分 位 数 统计 信息 如 下 所 示 ， 数 据 按 从 小 到 大 排序 后 ， 处 于 第 1 个 位 置 的 值 为 0.0， 第 4 个 
位 置 的 值 为 7.1 等 。 


K K-quantile 


1 0.0 

4 Tal 
7 9/155) 
10 100.0 


用 基本 统计 信息 和 分 位 数 统计 信息 分 别 计算 下 和 面 两 个 谓词 的 基数 : 
e Cl <=8.5: 表 上 共有 7 条 记录 满足 这 个 谓词 。 

使 用 基本 统计 信息 ， 基 数 估计 为 (KEY2 一 KEY1) / (HIGH2KEY 一 LOW2KEY) X Card 
= (85—5.1) / (93.6—5.1) X10 = 0.38， 存 在 很 大 的 偏差 。 而 使 用 分 位 数 统计 信息 ， 
由 于 第 7 个 位 置 的 值 为 853， 直接 得 到 基数 为 7， 与 实际 情况 完全 一 致 。 

e Cil <= 10: 表 上 共有 8 条 记录 满足 这 个 谓词 。 

使 用 基本 统计 信息 估计 的 基数 为 (10 一 5.1) / (93.6 一 5.1) X10 =0.55。 而 使 用 分 
位 数 统计 信息 ， 逢 要 将 这 个 谓词 作为 两 部 分 来 进行 估算 : Cl <= 8.5 的 基数 为 7, 而 Cl» 
8.5 AND C1 <= 10 的 基数 估计 为 (10 一 8.5) / (100 一 8.5) X (10 一 7) =0.05。 因 此 ， 
谓词 Cl <= 10 估计 为 7.05， 比 使 用 基本 统计 信息 要 精确 得 多 。 

我 们 再 用 统计 分 布 信息 来 分 析 这 个 得 询 的 基数 估计 : 


SELECT count (*) FROM TPCDS.STORE SALES WHERE SS EXT SALES PRICE > 50.00 and 
E SAE a R E 


对 表 TPCDS.STORE SALES 收集 分 布 统计 信息 后 ， 使 用 EXPLAIN PLAN WIHT 
SNAPSHOT 选项 打印 出 其 访问 计划 。 

如 下 所 示 ， 在 访问 计划 用 到 的 对 象 信息 中 ， 可 以 找到 列 SS EXT SALES PRICE 的 分 布 统 
计 信 息 ，DB2 收集 了 10 个 频 度 统计 信息 和 20 个 分 位 数 统 计 信 息 。 在 实际 过 程 中 ， 优 化 器 将 同 
时 使 用 频 度 统计 信息 和 分 位 数 统 计 信息 进行 基数 估计 。 这 里 为 简化 问题 ， 在 估计 这 个 区 间 谓 词 
的 过 小 因子 时 忽略 挥 频 度 统计 信息 的 影响 ， 仪 考虑 用 分 位 数 统计 信息 进行 估计 。 从 分 位 统计 信 
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息 中 可 以 看 到 ， 第 1620000 个 位 置 的 值 为 48.00， 而 第 5305001 个 位 置 的 值 为 148.00， 因 此 粗 
略 估计 ， 大 于 50.00 而 小 于 等 于 150 的 行 数目 约 为 5305001 一 1620000=3685001, 而 如 前 面 所 示 ， 


该 查询 的 实际 结果 为 3618913， 非 常 接近 。 
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Column Inrormarcion es 


Nemoc 16 


Name: 


Statistics Available: Yes 


SS EXT SALES PRICE 


Column sbtetuesbrtcs: 
Schema name of 


Name of column 


the column type: 


MOCE 


Maximum column length: 


Scale for decimal or timestamp column: 


Number of liSE1INGE Column values s 


Average column length: 


Number of most frequent values: 


Number of quantiles: 


Second highest data value: 


Second lowest data value: 


Column sequence in partition key: 


Average number of sub-elements: 


Average length of delimiters: 


Columa aa te 


Frequency Statistics: 


Valceoutt 


Value 


140000 
115000 
115000 
110000 
110000 
105000 
105000 
105000 
100000 
100000 


EURO 


+00076 


+00040. 
+00024., 
as 08 O18 es 


+00156 
+00064 
+00090 
700102 
+00016 


Quantile SŞSTtTarcistics- 


iz eoe 


Value 


2010 


.00 
00 
200 
.00 
.00 


SYSIBM 
DECIMAL 


10 
20 


100990. 00 
+00004.00 


0 
zzi 
gil 


40000 
565000 
1085000 
1620000 
2103000 
2675000 
3225000 


+00002 ~- 
700016. 


00 


+00034 ., 
+00048. 
3800105 20 
700076. 
tO00090. 


Di8gteount 

0 
0 

00 

00 

00 

00 

00 


So 


37530000 +00104.00 0 
4255001 100116- 00 0 
4770001 +00134.00 0 
5305001 100148.00 0 
9859001 +00162.00 0 
6330001 100176. 00 0 
6940001 +00192 .00 0 
73753001 +00224 .00 0 
282500 +00300.00 0 
8420001 -00384.00 0 
8960001 +00504.00 0 
9475001 +00670.00 0 
10000000 00990-00 0 
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因此 ， 如 条 一 个 数据 库 包含 很 多 重复 的 值 ， 或 者 数据 分 布 不 均 飞 ， 那 么 可 以 收集 分 布 统计 
信息 ， 这 样 DB2 优化 噩 就 能 更 精确 地 进行 基数 佑 计 ， 从 而 为 SQL 语句 生成 更 好 的 访问 计划 。 


Zh 注意 : 含 参数 和 主 变量 的 谓词 
如 果 SQL 语句 中 的 谓词 使 用 的 是 参数 或 者 主 变量 ， 比 如 CI = ?， 则 优化 器 用 不 上 分 
布 统计 信息 ， 只 能 使 用 基本 统计 信息 来 估计 基数 。 


4. 列 组 统计 信息 


如 果 SQL 语句 中 有 两 个 或 者 多 个 谓词 ,优化 器 在 估计 基数 时 假定 这 两 个 谓词 是 独立 的 。 但 
是 , 在 某 些 情况 下 ,这 两 个 谓词 或 者 多 个 谓词 并 不 独立 ， 也 就 是 说 这 些 列 上 的 数据 具有 相关 性 ， 
这 时 ， 优 化 器 估计 的 基数 就 会 存在 偏差 。 
例如 ，EMPLOYEE KERA 42 条 记录 ， 满 足 谓 词 JOB= “ANALYST ”的 数据 行 数 为 3， 
而 满足 WOKRDEPT=“C01” 的 行 数 为 4。 在 收集 了 分 布 统计 信息 后 ， 优 化 器 能 精确 地 估计 这 
两 个 谓词 的 过 滤 因 子 ， 分 别 为 3/42= 0.0714286 和 4/42= 0.0952381。 
X F ÆW select * from employee where job = ‘ANALYST’ and workdept = “C01”， 优 化 器 
会 假定 这 两 个 谓词 是 独立 的 ， 于 是 估计 基数 为 CardX (3/420 X (4/42) = 0.28571. Ri 
划 如 下 所 示 : 
0.28571 
SGN 
( 2) 
T 65299 


i 
| 
42 
TABLES DB2INSTI 
EMPLOYEE 
Q1 


BE ANAWE TÁN 3. XE KIEA E T workdept 和 job 的 数据 


具有 相关 性 导致 的 。 这 时 可 以 在 workdept 和 job 上 收集 列 组 统计 信息 , 修正 优化 器 的 基数 估计 。 
收集 列 组 基本 统计 信息 的 RUNSTATS 命令 如 下 所 示 : 
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RUNSTATS ON TABLE DB2INST1.EMPLOYEE ON ALL COLUMNS AND COLUMNS((workdept, job)); 


XIE, EAA SQL 语句 的 访问 计划 ， 如 下 所 示 ， 估 计 的 基数 为 2.8, 与 实际 行 数 非 第 接近 。 


2.8 

TBSCAN 

( 2) 

T 095133 
1 
| 
42 

TABLE: DB2INSTI 
EMPLOYEE 


当 多 个 列 的 数据 具有 相关 性 时 ， 列 组 统计 信息 不 仅 能 优化 上 述 局 部 谓词 的 基数 估计 ， 也 能 
对 多 个 列 连 接 谓词 的 基数 进行 更 精确 的 估计 。 
/o 注意 : 目前 DB2 还 不 支持 为 列 组 收集 分 7 
列 组 统计 信息 在 某 些 情况 下 能 帮助 优化 器 修正 基数 的 估计 。 不 过 ，DB2 还 不 支持 为 
列 组 收集 分 布 统计 人 信息， 因此， 优化 器 在 使 用 列 组 统计 信息 时 假定 数据 是 均匀 分 布 的 。 


9.2.6 用 优化 概要 定制 访问 计划 

很 多 熟悉 Oracle 的 读者 都 了 解 Oracle 的 hint， 它 允许 在 SQL 语句 中 插入 相关 的 语法 ， 从 
而 定制 SQL 的 访问 计划 。 在 DB2 中 ， 对 应 的 是 优化 概要 — Guideline) ， 也 可 以 定制 
任何 想 要 的 访问 计划 。 它 提供 了 两 种 方式 ; 一 种 是 艇 入 式 ， 男 一 种 是 独立 式 。 

1. 能 入 方式 


将 优化 概要 先入 在 SQL 语句 中 ， 使 用 这 种 方式 需要 首先 设置 注册 变量 DB2_ 
OPTPROFILE-YES 并 重启 DB2 服务 器 。 如 果 需 要 在 SQL 调 优 的 过 程 中 对 单条 SQL 语句 尝试 
各 种 不 同 的 访问 计划 ， 那 么 这 种 方式 就 很 适合 。 

接 下 来 用 一 个 例子 来 说 明 。 如 下 所 示 的 SQL 语句 使 用 了 骸 入 式 优化 概要 , 它 对 优化 器 生成 
访问 计划 作出 了 这 样 的 指示 

e 表 的 访问 路 径 : 访问 period 表 使 用 索引 PERIOD UIDX; 访问 product 表 使 用 表 扫 描 ; 

访问 sales 表 使 用 索引 扫描 ， 由 优化 器 根据 成 本 模型 为 其 选择 合适 的 索引 。 

e 连接 方式 和 顺序 : period 表 先 与 product 做 连接 操作 ， 连 接 方法 为 NLJOIN; 然后 再 与 

sales 表 连 接 ， 连 接 方法 为 NLJOIN。 


SELECT day, prod name, sum(cdollars) 
FROM product prd, period per, sales s 
WHERE prd.classkey = s.classkey and 
per.perkey = s.perkey and 
prd.prodkey = s.prodkey and 
prod name like 'Darjeeling%' and 
day in ("SA";, SU ) andl 
year = 2002 
group boy day, Prod name 
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/* «OPTGUIDELINES» 
«NLJOIN» 
«NLJOIN» 
XIXSCAN TABLE-'per' INDEX-'PERIOD UIDX'/» 
<TBSCAN TABLE-'prd'/» 
«/NLJOIN» 
XIXSCAN TABLE-'S'/» 
«/NLJOIN» 
«/OPTGUIDELINES» */; 


A 注意 : 优化 概要 中 的 表 名 f 
如 果 在 SQL 语句 中 对 表 名 使 用 了 别名 , 那么 在 优化 概要 中 也 必须 使 用 别名 ， 如 上 例 
中 优化 概要 ， 用 别名 *S" Xr sales X. 


我 们 可 以 使 用 db2exfmt 工具 打印 出 这 个 SQL 语句 的 访问 计划 ,从 下 面 可 以 看 出 :访问 period 
表 使 用 了 索引 扫描 PERIOD_UIDX, period 表 先 与 product 表 做 NLJOIN， 然 后 与 sales 再 做 
NLJOIN。 优 化 概要 为 sales 表 指 定 了 索引 扫描 但 没有 指定 特定 的 索引 ， 优 化 器 根据 成 本 模型 最 
终 选 择 了 索引 ZZ 11。 


Rows 
RETURN 
NI) 
COSE 
1/0 
| 
Sa LO2SA 
CREB 
í ^ x) 
21910,8 
151 
| 
Ed 
TBSCAN 
Eo» 
2, Ter s 
151 
| 
SMIS 5d 
EXE 
(4) 
21910,6 
lS 
| 
604.507 
NLJOIN 
[o 9) 
27882.2 


9221,8 0. 0655519 
NLJOIN PIERDE! 
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( 6) ( 10) 
14380.9 10 .4282 
ES 1.065535 
/--------- +--------- /----+----\ 
104.793 88 0. 0655519 69941 
ES EIN TBSCAN IXSCAN TABLE: DB2ADMIN 
( 1) ( 9 ) ( 11) SALES 
136.917 219,8035 9.89349 Q3 
4 11 1 
/---+----\ | | 
822 822 1298 69941 
IXSCAN TABLE:DB2ADMIN TABLE:DB2ADMIN INDEX: DB2ADMIN 
( 8) ERETO RRODUCH Zn LI 
58- 184G Q4 Q5 Q3 
0 
| 
822 


INDEX: DB2ADMIN 
PERIOD UIDX 
Q4 


2. 独立 方式 


将 优化 概要 骨 入 到 SQL 语句 中 ， 在 实际 项 目 中 并 不 是 一 个 好 的 方式 ， 因 为 数据 是 变化 的 ， 
在 某 一 时 刻 使 用 这 个 访问 计划 是 最 优 的 , 在 为 一 个 时 刻 , AH RI SETR Z6, 这 时 再 来 修改 应 用 中 SQL 
语句 的 优化 概要 ， 很 不 方便 。 独 立方 式 可 以 解决 这 个 问题 , 它 用 独立 的 文件 存储 SQL 语句 和 相 
应 的 优化 概要 ， 并 注册 到 DB2 中 。 这 样 ， 当 需要 改变 访问 计划 时 ， 不 用 修改 SQL 语句 本 刁 ， 
只 要 修改 独立 文件 的 内 容 就 行 了 。 

不 同 于 般 入 方式 ， 使 用 独立 方式 时 不 需要 设置 注册 变量 DB2 OPTPROFILE=YES， 下 面 介 
绍 使 用 独立 方式 的 四 个 步骤 。 

(1) 创建 OPT PROFILE X 

OPT PROFILE 表 用 于 存储 优化 概要 文件 ， 可 以 调用 sysinstallobjects 存储 过 程 目 动 创建 或 
者 使 用 CREATE TABLE 语句 手工 创建 。 

如 下 所 示 ， 其 中 schema 和 name 是 组 合 主键 ， 用 来 唯一 确定 某 个 优化 概要 。 


call sysinstallob]ects( opt profiles, e US 


wed 


CREATE TABLE SYSTOOLS.OPT PROFILE ( 
SCHEMA "VARCHAR(128) NOT NULL, 
NAME VARCHAR(128) NOT NULL, 
PROFILE BLOB (2M) NO 
PRIMARY KEY ( SCHEMA, NAME ) 
); 


(2) 创建 OPT PROFILE 文件 
优化 概要 文件 是 一 个 标准 的 XML 文件 。 如 下 所 示 ， 名 为 opt profl.xml 的 优化 概要 文件 中 ， 
根 节点 为 OPTPROFILE， 其 下 可 以 有 多 个 STMTPROFILE, 每 个 STMTPROFILE 指定 一 条 SQL 
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语句 的 优化 概要 。STMTPROFILE 主要 由 两 部 分 组 成 ，STMTKEY 包含 SQL 语句 ， 而 
OPTGUIDELINES 指定 相应 的 优化 概要 , 在 STMTKEY 中 可 以 用 属性 SCHEMA 指定 SQL 语句 
所 引用 表 的 默认 模式 ， 比 如 例子 中 指定 默认 模式 为 DB2ADMIN。 


«?xml version-"1.0" encoding-"UTF-8"?-2 
<OPTPROFILE> 
<STMTPROFILE ID="Q1"> 
<STMTKEY SCHEMA="DB2ADMIN"><! [CDATAL 
SELECT DAY, Proc name, sum (dollars) 
FROM product prd, period per, sales s 
WHERE prd.classkey = s.classkey 
and per.perkey = s.perkey 
and prd.prodkey = s.prodkey 
andi proci name like “Darjeelings' 
and day im ("SA",;, SU ) 
and year = 2002 
group by day, Prod name 
] ] ></ STMTKEY > 
<OPTGUIDELINES> 
<NLJOIN> 
<NLJOIN> 
<IXSCAN TABLE-'per' INDEX-'PERIOD UIDX'/» 
X«TBSCAN TABLE-'prd'/» 
«/NLJOIN» 
“TXOCAN TABIE /> 
</NLJOIN> 
</OPTGUIDELINES> 
</STMTPROFILE> 
«ZOPTPROEBITDE— 


人 注意 : 优化 概要 文件 的 SQL 语句 
优化 器 使 用 STMTKEY 的 SQL 语句 匹配 实际 应 用 中 的 SQL i& 6], AF Vt B6 ge RA 
大 小 写 区 别 和 空格 多 少 ， 但 其 他 方面 必须 一 致 。 


(3) 注册 优化 概要 
注册 优化 概要 ， 即 将 优化 概要 文件 存储 到 第 一 步 创 建 的 SYSTOOLS.OPT_ PROFILE 表 中 。 
首先 编辑 如 下 内 容 ， 并 保存 到 opt profl.del 中 。 这 里 的 内 容 与 表 SYSTOOLS.OPT PROFILE 4 
构 一 致 ， 第 一 个 值 指定 优化 概要 的 模式 DB2ADMIN ， 第 二 个 值 指定 优化 概要 的 名 字 
OPT PROF1， 第 三 个 值 指 定 优化 概要 文件 的 名 字 ， 示 例 中 为 opt profl.xml. 


-- XÍftopt profl.del 
"DBZ2ADMIN”";, “OPT PROFI", “Opt proti xml“ 


然后 用 import 命令 将 opt profl.del 导入 到 表 SYSTOOLS.OPT PROFILE 中 , 这 样 就 完成 了 
这 个 优化 概要 的 注册 ， 所 使 用 的 命令 如 下 所 示 : 


import from opt proti. del of del modirtied by Lobsintile 
四 
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注册 概要 文件 后 ， 使 用 下 面 的 flush 命令 刷新 缓存 中 的 优化 概要 。 


Flush optimizacion profile cache all; 


(4) 使 用 优化 概要 

最 后 ， 使 用 set current optimization profile 命令 设置 当前 要 使 用 的 优化 概要 。 优 化 概要 由 
SYSTOOLS.OPT PROFILE 中 schema 和 name 组 合 主键 标识 ， 示 例 中 为 DB2ADMIN.OPT 
PROF1， 于 是 接 下 来 的 查询 就 能 用 到 这 个 优化 概要 : 


set current optimization profile - 'DB2ADMIN.OPT PROF1'; 


set current schema db2admin; 
set current explain mode explain; 
SELECT day, Proc name, sum (dollars) 
FROM product prd , period per, sales s 
WHERE prd.classkey = s.classkey 
and per.perkey = s.perkey 
and prd.prodkey = s.prodkey 
and! prod _ name like "Darjeeling%s 
anc) day im (“SA";, Su 
and year = 2002 
group by day, prod name; 


set current explain mode no; 


在 db2exfmt 打印 的 访问 计划 中 ， 如 下 所 示 ， 其 中 有 一 段 关 于 优化 概要 的 信息 ， 示 例 中 这 个 
SQL 语句 使 用 的 优化 概要 为 DB2ADMIN.OPT PROF1， 而 语句 优化 概要 名 字 为 Q1， 与 
opt profl.xml 中 STMTPROFILE 的 ID 一 致 。 


Profle Infrormarcions 


OPT_PROF: (Optimization Profile Name) 
DB2ADMIN.OPT_PROF1 

STMTPROF: (Statement Profile Name) 
Q1 


Original Statement: 


9.3. KERDE $m 


为 了 进一步 帮助 读者 掌握 SQL 语句 优化 技巧 并 应 用 到 实战 中 , 本 节 将 与 读者 分 享 我 们 在 实 
际 调 优 过 程 中 分 析 问 题 和 解决 问题 的 过 程 和 心得 休会。 每 一 个 实战 案例 ， 都 是 由 问题 描述 、 诊 
断 分 析 、 解 决 方案 共 3 部 分 内 容 组 成 的 ， 建 议 读者 阅读 完 问题 描述 和 诊断 分 析 后 ， 先 自己 思考 
一 下 解决 方案 ， 随 后 再 和 书 中 提供 的 解决 方案 进行 对 比 ， 这 样 学 习 起 来 印象 更 深刻 ， 效 果 也 更 
好 一 些 。 
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9.3.1. 案例 1: 不 可 思议 的 物理 读 次 效 
在 SQL 语句 优化 过 程 中 , 要 深入 掌握 物理 设计 、 罗 辑 设计 和 数据 库 的 配置 参数 等 基本 知识 ， 
因为 很 多 SQL 语句 性 能 不 佳 是 由 于 数据 库 设计 或 者 配置 不 当 导致 的 。 


1. 问题 描述 


国内 某 银 行 客户 报告 了 一 个 性 能 问题 ， 他 们 的 业务 系统 搭建 在 两 套数 据 库 上 ， 一 套 是 生产 
库 ， 一 套 是 复制 库 ， 两 套数 据 库 之 间 通过 复制 工具 实现 实时 同步 。 但 是 ， 报 表 查 询 应 用 有 关 的 
SQL 语句 ,在 生产 库 上 的 响应 速度 很 好 , 但 在 复制 库 上 却 很 差 。 它 们 的 具体 性 能 参数 如 下 所 示 ， 
在 复制 库 上 运行 的 响应 时 间 要 比 生产 库 多 十 几 僧 。 


Server Database Execution time 
Production pmdb 8 min 53 sec 
Replication pmrep Around 123 min to 165 min 


客户 告诉 我 们 ， 复 制 库 与 生产 库 的 使 件 配置 完全 一 样 ，DB2 版 本 都 是 V9.5， 数 据 也 完全 
一 致 ， 唯 一 区 别 在 物理 设计 上 : 复制 库 使 用 的 是 目 动 存储 表 空 间 ,， 生产 库 是 非 目 动 存储 表 空 间 。 
2. 诊断 分 析 


尽管 客户 声称 唯一 的 区 别 为 自动 存储 表 空间 , 但 还 需要 再 次 确认 。 让 客户 收集 了 db2support 
信息 ， 发 现 这 两 个 数据 库 环境 有 了 两 点 不 同 : 

e 系统 类 型 操作 系统 均 为 Linux， 但 是 生产 库 为 390 平台 ， 而 复制 库 为 x86 平台 。 

e DB2 的 版 本 : 生产 库 为 V9.5.4， 复 制 库 为 V9.5.8。 

下 面 是 具体 的 诊断 分 析 步 骤 。 

CIO MAr jeh EEN 

但 都 不 奏效 ， 例 如 收集 列 上 的 分 布 统 计 信 息 、 为 一 些 SQL 语句 新 建 组 合 索 引 、 启 用 一 些 环 
卉 注册 变量 等 。 

(2) 选择 一 条 关键 SQL 语句 作为 切入 点 

由 于 报表 查询 应 用 涉及 的 SQL 语句 较 多 ， 为 了 加 快 问题 的 处 理 ， 从 中 选择 一 条 关键 SQL 
语句 ， 请 客户 在 复制 库 运 行 ， 在 运行 的 过 程 中 进行 监控 并 收集 快照 信息 。 

(3) 分 析 快 照 信息 

在 应 用 程序 快照 中 ， 发 现 CPU 的 时 间 为 74.8 秒 ， 只 占 整 个 运行 时 间 很 小 一 部 分 ， 这 说 明 
CPU 不 是 问题 。 

Hæ, VO 开销 却 很 大 ， 其 中 数据 物理 读 次 数 为 103977， 有 索引 物理 谈 次 数 高 达 737988, 15] 
超过 逻辑 读 次 数 的 10%。 再 结合 数据 库 快 照 ， 发 现 索 引物 理 谈 大 部 分 是 同步 谈 ， 没 有 实现 异步 
预 取 。 所 以 ， 重点 怀疑 的 就 是 物理 读 了 。 

应 用 程序 快照 和 数据 库 快照 信息 如 下 所 示 : 


Application Snapshot 


Application handle = 51776 
Application status = UOW Executing 


DB2 设计 、 管 理 与 性 能 优化 艺术 


Buffer pool data logical reads = 606274 
Buffer pool data physical reads = 103977 
Buffer pool index logical reads = 7672398 
Buffer pool index physical reads = 737988 
Total buffer pool read time (milliseconds) = 5549225 
Total Statement user CPU time = 74.841954 
Total Statement system CPU time = 0.000000 
Rows read = 1093028 


Database Snapshot 


Buffer pool index logical reads = 10070184 
Buffer pool index physical reads = 831266 
Asynchronous pool index page reads = 371734 


(40 分 析 关 键 SQL 语句 的 访问 计划 


访问 计划 中 的 相关 片段 如 下 所 示 ， 可 以 看 到 ， 这 个 访问 计划 用 到 了 5 个 索引 ， 并 需要 访问 
基本 表 WR PMT: 


0.0554048 
NLJOIN 
( 6) 
301663 
La uris ae N 
125800.3 Ta 6353596=07 
EXC BESTES 
(o7) (14) 
270838 Ze 
+ 一 一 一 一 一 一 一 一 一 + 一 一 一 一 一 一 一 一 一 一 十 一 十 一 一 一 一 一 一 一 一 一 二 一 一 一 一 一 一 一 一 一 一 一 + | 
7101259 1.31e-06 2a 16596 1,4819 1.28818 1 
IOA Table: ISCAN ISCAN ISCAN GRPBY 
( 8) WR PMT (11) (EE) (13) (15) 
2099,33 21.304 21.3016 21.3013 21,3016 
| | | | | 
701259 1.11487e+06 1.3le+06 1.,11662e+06 1.16112 
SORT Index: Index: Index: ISCAN 
(EEO) IND WP 06 IND OR 04 PK EM 01 (16) 
PEPPER Zire 0A 
| | 
701259 1T es 
ISCAN Index: 
(10) IND_EIO 02 
2420.81 


| 
1.11662e+06 
Index: 


IND WP 05 
而 访问 计划 中 这 些 表 和 索引 的 统计 信息 如 下 所 示 , 表 WR PMT 的 总 页 数 为 29597， 比 数据 
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物理 恋 次 数 103977 少 得 多 ， 而 5 个 索引 (包括 IND WP 05. IND WP 06. IND OR 04, 
PK EM 01 4I IND EIO 02) 的 页 数 总 和 都 远 远 不 及 索引 物理 读 的 次 数 737988. 


Name : WR PMT 
Een PM 
Number of Columns: 58 
Number of Pages with Rows: 29597 
Number of Pages: 29597 
IND We TOS Inde Ledai JS I2 
INDA WETO nide Ledai od SC 546 
IND OR 04A index Leaf Rages: S T0 S 
BK EM 01 Index Leaf Pages: 3201 
本 本 下 SUO SEI 


(5) 检查 物理 设计 ， 包 括 表 空间 和 绥 冲 池 使 用 情况 
顺 滕 摸 瓜 ， 继 续 查 看 相关 表 空 间 和 绥 冲 池 的 定义 ， 表 WR_PMT 的 数据 表 空 间 和 索引 表 空 
间 分 别 为 TS WP 03 和 IX WP 03. 


CREATE T REGULARTTABLESEACE TS WEIO03 TIN DATABA ETEA TITIONT GROUP I BMDEFAULTGROUR 
PAGESIZE 16384 MANAGED BY AUTOMATIC STORAGE 
UU OR EEES 
BUFFERPOOL PM BP08 


CREATEIPECGULARITABLEES EACE TTX WP O03 TN DATABASE T PARIITION GROUP TI BMDEFAULTGROUR 
PAGESIZE 16384 MANAGED BY AUTOMATIC STORAGE 
BUFFERPOOL PM BPO08 


CREATE TABLE "PM a a 
tj a 


这 两 个 表 空 间 均 使 用 缓存 池 PM BPOS. 但 它 的 尺寸 在 生产 库 和 复制 库 上 是 不 一 样 的 , 在 生 
产 库 上 有 64000 页 。 


-- 生 产 库 pmdb 
(ISSN CIDIENS E. DPI EIER eO "PM BPO8" SIZE 64000 PAGESIZE 160384; 


但 是 ， 缓 存 池 PM. BPOS 在 复制 库 上 的 尺寸 竟然 只 有 250 个 页 ， 这 也 太 小 了 1 
-- 复 制订 pmrep 


CREATE BUFFERPOOL "PM BP08" SIZE 250 PAGESIZE 10384; 


3. 解决 方案 


解决 方案 水 到 渠 成 ， 在 复制 床上 上， 调整 PM BPOS 绥 冲 池 大 小 为 64000 页 ， 这 样 丈 和 生产 
库 一 样 了 ， 使 用 的 语句 如 下 所 示 : 


ALTER BUFFERPOOL PM BP08 IMMEDIATE SIZE 64000; 


当然 ， 如 果 DBA 在 缓冲 池 调 优 方面 经 验 不 足 ， 建 议 局 用 STMM 对 其 进行 目 动 化 调整 。 
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E 口 大 得 分 享 ， 对 战争 理论 和 实践 缺乏 基本 了 解 ， 贸 然 上 战场 指挥 战争 ， 可 能 会 导致 全 军 
覆没 。 同 理 ， 如 果 对 调整 缓冲 池 大 小 这 样 的 基本 功 都 没有 掌握 好 ， 那 么 性 能 调 优 就 无 
从 谈 起 。 读 者 读 完 这 个 案例 后 ， 应 该 反问 自己 : 平时 的 功课 是 否 做 得 足够 好 ? 


9.3.2 ”案例 2: 理想 的 索引 没 用 上 


1. 问题 描述 


某 著名 投资 银行 报告 了 一 个 性 能 问题 ， 根 据 查 询 条 件 创建 了 一 个 组 合 索 引 ， 但 是 从 访问 计 
划 上 看 ， 这 个 索引 没有 用 上 ， 从 而 导致 查询 性 能 不 高 ， 竟 然 需要 6 分 钟 才能 返回 结 
这 条 得 询 语句 如 下 所 示 ， 碍 询 条 件 使 用 到 了 字段 SYSTEM. TAG DATE JI TAG: 


BLECT Nus 
PROM AGDB Orders nistory 
WHERE system ~ 'jmb' AND tag date - '08/06/2012' and tag ~ '927' 


创建 的 组 合 索 引 如 下 所 示 ， 组 合 索 引 ORD HISTORY IDXC 使 用 到 了 字段 SYSTEM. 
TAG DATE. TAG 和 VERSION。 这 个 组 合 索 引 完 全 匹配 了 得 询 中 的 3 个 谓词 条 件 ， 而 且 这 个 
索引 是 聚集 索引 (CLUSTER) ， 应 该 是 很 理想 的 索引 ， 但 是 该 查询 的 访问 计划 没有 用 到 这 个 索 
引 ， 导 致 性 能 不 高 。 
CREATE UNIQUE INDEX "AGDB YORD HISTORY IDXC™ ON "AGDB ORDER S MISI SRI CONES 
(o S RMUTUSASÁSO 
TAG IDA ASC, 
AGURA SOF 


"VERSION" ASC) 
CLUSTER ALLOW REVERSE SCANS; 


下 面 是 具体 的 诊断 分 析 步 骤 。 
(1) 首先 查看 表 AGDB.ORDERS HISTORY 和 相关 索引 的 定义 : 


CREATE TABLE "AGDB "."ORDERS HISTORY" ( 
"SYS CATEGORY" SMALLINT NOT NULL , 
"SYSTEM" VARCHAR(32) NOT NULL , 
"TAG" VARCHAR(40) NOT NULL , 
tower De me Orate NOT NOLE 7 
"VERSION" INTEGER NOT NULL , 
PEL IPTE 
"PROD ID" VARCHAR(33) , 
NU T 
"CUSTODIAN BANK" VARCHAR(256) , 
"PEG TYPE" SMALLINT ) 
COMPRESS YES 
DUANE IPOD 
CREATE INDEX “AGDE  "."ORD HIS INSERT TIME" ON "AGDB  "."ORDERS HISTORY" 
("INSERT TIME" ASC) 
ALLOW REVERSE SCANS; 
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CREATE INDEX "AGDB " YORD HIST 1D3 ON "AGDB OD dabit S TOT n 


("SYSTEM" ASC, 
"TRANS TIME" ASC) 


ALLOW REVERSE SCANS; 


CREATE INDEX "AGDB "."ORD HIST ID4" ON "AGDB ". "ORDERS HISTORY" 


("TAG DATE" ASC, 
"PROD ID" ASC) 
ALLOW REVERSE SCANS; 
CREATE UNIQUE INDEX "AGDB  "."ORD HISTORY IDXC" ON "AGDB  "."ORDERS HISTORY" 
("SYSTEM" ASC, 
"TAG DATE" ASC, 
"TAG" ASC, 
"VERSION" ASC) 
CLUSTER ALLOW REVERSE SCANS; 
ALTER TABLE "AGDB "."ORDERS HISTORY" 
ADD CONSTRAINT "ORDERS H PK1" PRIMARY KEY 
("SYSTEM", 
Je paa e 
TACUT 
"VERSION"); 


(2) 查看 访问 计划 。 
通过 db2exfmt 工具 查看 其 访问 计划 


Original Statement: 


SELECT “ 
FROM AGDB Orders history 
WHERE system — 'jmb' AND tag date —- '08/06/2012' and tag - '927' 
Access Plan: 
Total Costs 22 1306 
Query Degree: 1l 
ROWS 
RETURN 
( 1) 
COST 
I/O 
| 
7-9039 
FETCH 
( 2) 
22. 1306 
S 
Apc 
8 9 9191268409 
EDS C TABLE: AGDB 
( 3 ) ORDERS OE 
15.1481 Q1 


2 
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8 
SORT 
( 4) 
Io 1478 
2 
| 
8 
IXSCAN 
( 2) 
15.1469 
2 
| 
9.81912e408 
INDEX: AGDB 
ORD HIST ID4 
Q1 


从 访问 计划 可 以 看 到 ，DB2 wir [f Il ORD HIST IDA(TAG DATE, PROD ID) 
用 做 索引 扫描 ， 但 它 只 能 用 到 TAG DATE 谓词 ， 不 能 使 用 其 他 两 个 谓词 SYSTEM M TAG. 3X 
条 查询 竟然 需要 6 分 钟 才 返回 结果 ! 

从 原理 上 看 ， 组 合 索 引 ORD HISTORY IDXC(SYSTEM,TAG DATE,TAG,VERSION) 更 理 
想 ， 完 全 匹配 了 得 询 中 的 3 个 谓词 条 件 。 

有 趣 的 是 ， 如 果 将 tag date 上 的 值 从 “08/06/2012” 改 为 “06/03/2012”， 查 询 只 需 0.2 fb 
aL Beas [nl £s A. 


SELECT % 
EROM AGDB Orders nistory 
WHERE system = 'jmb' AND tag date = '06/03/2012' and tag = '927' 


(3) 针对 不 同 的 tag date， 对 比 它 们 的 访问 计划 。 

如 果 使 用 TAG DATE = '06/03/2012' 这 个 谓词 ， 优 化 堪 选 择 索 引 ORD HISTORY IDXC 
(SYSTEM,TAG DATE,TAG,VERSION) 。 从 下 面 的 访问 计划 可 以 看 出 ， 这 个 谓词 过 小 因子 为 
0.00689303， 由 于 这 个 表 是 是 9 干 多 万 行 的 大 表 ， 如 果 只 用 这 个 谓词 过 小， 得 到 的 中 间 结 果 集 
大 小 估计 为 9.81912e+08X0.00689303=6768348， 依然 很 大 ， 因 此 还 需要 结合 其 他 两 个 谓词 有 效 
地 过 滤 不 需要 的 数据 行 。 这 种 情况 下 ， 使 用 ORD _HISTORY IDXC 的 性 能 更 局 。 


3) Start Key Predicate 


Comparison Operator: Equal (=) 
Subquery Input Required: No 
Filter Factors 0.00689303 


Predicate Text: 


(Ol1.TAG DATE = '06/03/2012'") 


3) Stop Key Predicate 


Comparison Operator: Equal (=) 
Subquery Input Required: No 
Filter Factors 0.00689303 
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Predicate Text: 


(Q1.TAG DATE = '06/03/2012'") 


如 果 使 用 tag_date = '08/06/2012' 这 个 谓词 ， 优 化 器 选择 索引 ORD HIST IDA(TAG DATE, 
PROD_ID〉。 从 下 面 的 输出 可 以 看 到 这 个 谓词 的 过 滤 因 子 非常 小 ,为 8.14737e-09， 如 果 只 用 这 
个 谓词 过 滤 ， 得 到 的 中 间 结 果 集 大 小 估计 为 9.81912e+08X8.14737e-09=8。 这 说 明 优 化 器 认为 
HIE tag date 这 个 谓词 就 能 有 效 地 过 滤 掉 不 需要 的 行 ! 从 这 点 上 看 ， 采 用 ORD HIST IDA 或 
ORD HISTORY IDXC 并 没有 区 别 。 


3) Start Key Predicate 


Comparison Operator: Equal (=) 
Subquery Input Required: No 
Filter Factors 8.14737e-09 


Predicate Text: 


(OL .TAG DATE = '08/06/2012") 


3) Stop Key Predicate 


Comparison Operator: Equal (=) 
Subquery Input Required: No 
Filter Factor: 8.14737e-09 


Predicate Text: 


(Q1.TAG DATE - '08/06/2012') 


再 看 两 个 索引 的 统计 信息 ， 发 现 ORD HIST IDA 的 层级 为 3 (B+ 树 的 层级 ) ， 而 
ORD HISTORY IDXC 是 一 个 4 级 索引 ， 这 说 明 ORD HISTORY IDXC 的 索引 树 大 很 多 。 

如 前 面 访问 计划 中 的 VO 成 本 所 示 ，IXSCAN 的 VO 成 本 为 2，FETCH 的 IO 成 为 3。 由 于 
TAG DATE = '08/06/2012' 上 其 有 非常 低 的 过 小 因子 (8.14737e-090 ， 优 化 器 认为 经 过 这 个 谓词 
过 滤 后 只 返回 8 行 数据 ， 已 经 足够 将 基本 表 的 IO 降低 到 1 个 页 面 ， 使 用 索引 ORD HIST ID4 
加 上 2 个 索引 页 Vo, 共 3 个 1O。 而 使 用 索引 ORD HISTORY IDXC 可 能 需要 4 个 IO 或 者 更 
多 LO 成本， 因此 优化 器 认为 采用 ORD. HIST IDA 成 本 更 低 。 

那么 ， 为 什么 优化 器 的 估计 与 实际 性 能 不 符 呢 ? 

进一步 租 看 访问 计划 的 对 象 详细 信息 ， 发 现 统计 信息 的 更 新 日 期 是 06/31/2012， 这 在 
08/06/2012 以 前 ， 也 就 是 说 TAG DATE ='08/06/2012' 的 数据 并 没有 体现 在 统计 信息 中 ,于 是 优 
化 器 使 用 了 不 准确 的 统计 信息 计算 出 过 滤 因 子 为 8.14737e-09,， 从 而 导致 优化 器 选择 了 错误 的 索 
5| ORD HIST_ID4， 合 适 的 案 引 ORD HISTORY IDXC 却 没 有 用 上 。 


Objects Used in Access Plan: 
Schema: | AGDB 
Name: ORDERS HMISTORY 
Type: Table 
Time of creation: 2005=07=28=09.06.04.6007513 
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Last statistics update: 2012-06-31-04.10.23.193874 


找到 问题 所 在 ， 解 决 方案 其 实 很 简单 ， 使 用 下 面 的 RUNSTATS fie SUIS T dx UR SI 
的 统计 信息 即 可 ， 随 后 重新 执行 这 个 碍 询 ， 啊 应 时 间 降 低 到 0.2 £^: 


runstats on table AGDB. orders nistory with distribution anë indexes alls 


lies. 统计 信息 是 优化 器 的 “导航 仪 ”， 要 想 优 化 器 正确 工作 ， 就 需要 及 时 更 新 统 


9.3.3 ”案例 3: 标记 位 (Flag) 数据 上 的 runstats 时 机 


1. 问题 描述 


某 客户 在 维护 窗口 运行 批 处 理 程序 时 ， 对 数据 库 现 有 数据 做 了 一 些 清理 工作 ， 然 后 执行 
reorg 和 runstats 操作 。 全 部 执行 完毕 后 , 发 现 某 条 关键 SQL 语句 的 性 能 降低 了 : 维护 操作 之 前 ， 
该 SQL 语句 的 执行 时 间 约 为 12 秒 ， 而 维护 操作 之 后 ， 执 行 时 间 增 加 到 34 秒 以 上 。 

具体 的 性 能 数据 由 db2batch 工具 得 出 : 


db2batch 测试 的 性 能 结果 : 运 维 操作 之 前 


* Total "bee 11.953375 seconds 
db2batch 测试 的 性 能 结果 : 运 维 操作 之 后 
* Total Time: 34.430621 seconds 


2. 诊断 分 析 

下 面 是 具体 的 诊断 分 析 步 又。 

CD 对 比 访问 计划 

维护 操作 前 ， 这 条 SQL 语句 的 访问 计划 如 下 所 示 : 表 TRBK13 和 表 TRFAOI 之 间 使 用 
HSJOIN 做 连接 ，HSJOIN 操作 符 的 基数 (返回 行 数 ) 估计 为 2383.39: 

维护 操作 前 的 访问 计划 (性 能 好 )〉: 


2383.39 


^HSJOIN 
( 18) 
197403 
13:40) 292 
I 再 三 二 二 三 二 N 
332906 6083.32 
TBSCAN TBSCAN 
(1 DIES ( 20) 
80566.9 116790 
45160 65632 
| | 
665811 849703 


TABLE: DB2ADMIN TABLE: DB2ADMIN 


3/4 


TRBK13 TRFAO1 
Q8 e 
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维护 操作 后 ， 这 条 SQL 语句 的 访问 计划 如 下 所 示 ， 表 TRBK13 和 表 TRFAOI 之 间 使 用 
NLJOIN WOE, NLJOIN 操作 符 的 基数 〈 返 回 行 数 ) 估计 为 0.007: 


维护 操作 后 的 访问 计划 《性 能 着 ) : 


0.00715935 


^NLJOIN 
€ l8] 
80592.6 
45162 
4 Eoo N 
1 OTOOTO 
TBSCAN FETCH 
Caen mE 
80566.9 000018816 
45160 3 
| G E 
665810 1 849703 
TABLE: DB2ADMIN IXSCAN TABLE: DB2ADMIN 
TRBK13 QURE TRFAO1 
Q8 2.5. 2186 Q9 
p 
| 
849703 
INDEX: SYSIBM 
S0L060502225749960 
Q9 


从 访问 计划 中 ， 可 以 看 出 运 维 前 后 ， 访 问 计划 中 基数 差别 巨大 ， 这 时 有 理由 怀疑 基数 估计 


存在 偏差 ， 因 此 从 这 点 入 手 分 析 问 题 。 
(2) 对 比 过 滤 因 子 
继续 查看 访问 计划 的 详细 信息 输出 ， 


对 比 过 滤 因 子 ， 发 现 维 护 操 作 前 后 对 


“Q8.RONRI SAKUZYO FLG <> :?” 这 个 谓词 的 过 滤 因 子 有 着 天 壤 之 别 ， 分 别 为 0.5 和 


1.50592e-06， 如 下 所 示 : 


性 能 好 的 HSJOIN: 
44) Sargable Predicate 
Comparison Operator: 
Subquery Input Required: 


Filter Factor: 


Predicate Text: 


(Q8B.RONRI SAKUZYO FLG <> : 


性 能 差 的 NLJOIN: 
44) Sargable Predicate 
Comparison Operator: 


Subquery Input Required: 


Not Equal (<>) 
No 
0.5 
ED 
Not Equal (<>) 
No 
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Filter Factor: 1.50592e-06 


Predicate Text: 


(Q8 .RONRI SAKUZYO FLG <> :?) 


(30 Jacke LE BUTS 
确认 后 ， 发 现 Q&RONRI SAKUZYO FLG 这 个 字段 是 个 标记 位 ， 在 维护 操作 前 有 0 和 I 
两 个 值 ， 而 维护 操作 后 ， 根 据 业 务 罗 辑 的 需要 ， 所 有 的 数据 行 全 是 0。 
实际 上 ， 当 某 个 学 段 上 所 有 数据 都 是 同一 个 值 时 ，DB2 估计 等 于 (=) 和 不 等 于 (<>) dB 
词 的 过 小 因子 是 截然 不 同 的 : 
e RONRI SAKUZYO FLG <>?: DB2 会 认为 传 入 的 参数 值 正好 是 列 上 的 这 个 值 ， 也 束 
是 没有 行 会 满足 条 件 ， 因 此 估计 极 低 的 过 滤 因 子 ， 从 而 估计 很 低 的 基数 ， 接 近 于 0。 在 
这 个 案例 中 ， 维 护 操作 后 ， 这 个 字段 全 部 变 成 0， 优 化 器 估计 了 极 低 的 过 滤 因 子 
1.50592e-06， 极 低 的 基数 0.007. 
e RONRI SAKUZYO FLG=? : DB2 同样 认为 传 入 的 参数 值 正好 是 列 上 的 这 个 值 ， 也 整 
是 所 有 行 都 满足 条 件 ， 因 此 估计 很 高 的 过 滤 因 子 ， 接 近 于 1。 


针对 这 个 标记 位 的 统计 信息 问题 ， 有 如 下 解决 方案 : 

(1) 使 用 REOPT ALWAYS 选项 重新 绑 定 包含 这 条 SQL 语句 的 存储 过 程 ， 命 令 如 下 所 示 
(详情 请 参考 9.5.9 市 ) 。 这 样 ， 每 次 存储 过 程 执行 时 ，DB2 都 会 根据 实际 传 入 的 值 重 新 编译 
这 条 SOL 语句 ， 于 是 优化 器 就 能 生成 正确 的 访问 计划 。 


CALL SYSBROC .REBIND ROUTINE PACKAGE ("P"; "DBZ2ADMIN,.TRBKPROC, "REOPT ALWAYS") 


当然 ， 当 这 两 个 表 的 数据 变化 时 ， 应 该 及 时 用 RUNSTATS 命令 收集 统计 信息 ， 使 得 优化 
器 能 作出 正确 的 基数 估计 。 
(25 使 用 如 下 优化 概要 定制 访问 计划 ， 使 用 固定 的 HSJOIN 连接 这 两 个 表 。 
/*<OPTGUIDELINES> 
<HSJOIN> 
<ACCESS TABID='081/> 
<ACCESS TABID=" 090"/> 


</HSJOIN> 
</OPTGUIDELINES>*/ 


(3) 对 这 条 SQL 语句 进行 修改 ,使 用 RONRI SAKUZYO FLG = ? 代替 原来 的 不 等 谓词 
RONRI SAKUZYO_FLG<> ?， 并 修改 相关 应 用 程序 ， 使 得 调用 该 存储 过 程 时 传 入 相反 的 值 。 
这 样 修 改 后 ， 访 问 计 划 将 会 使 用 HSJOIN， 并 且 这 个 谓词 的 过 滤 因 子 将 从 1.50592e-06 变 为 1.0. 


dv (5 
VT) 


NN 
八 >， 


F: 标记 位 在 数据 建 模 中 广泛 应 用 ， 但 标记 位 数据 的 统计 信息 收集 需要 格外 留 
要 把 握 好 时 机 ， 让 标记 位 的 统计 信息 正确 反映 实际 的 数据 分 布 。 


376 


$93 SOL 4 4445: 9 


9.3.4 ”案例 4: NLJOIN vs HSJOIN 大 比拼 
1. 问题 描述 


某 客户 报告 了 一 个 SQL 语句 的 性 能 问题 ,由 于 这 条 查询 每 天 会 执行 几 十 万 次 , 所 以 对 整个 
系统 的 性 能 有 较 大 影响 。 
先 来 看 这 条 查询 ， 它 在 OA MEMPRO 和 OA NODE 这 2 个 表 上 做 连接 ， 并 不 算 复杂 : 


SELECT DISTINCT OA MEMPRO. EXID, OA MEMPRO MEMBERID, 
OA MEMPRO.MEMBERDISP, OA MEMPRO.EMAIL, 
OQA MEMPRO o- MEMBERTY PE, OA MEMPRO DYNAMIC, 
OA MEMPRO.LOCALE, OA MEMPRO.CREATED, 
OA MEMPRO c Ies Nn os c EL 
TROM ACTIVITIES OA MEMPRO OA MaMPRO, ACTIVITIES- OA NODE NI, 
ACTIVITIES- OA NODE N2 
WHERE N1.ACTIVITYUUID-N2.ACTIVITYUUID AND 
N2 .CREATEDBY=OA MEMPRO.MEMBERID AND 
OA MEMPRO.MEMBERID!='003G091E0E4B47/BEF6967B3131AD59007A53' AND 
N1.CREATEDBY-'079G092D5B5E581369FD7FDA9AEEFA00627C' 
ORDER BY OA MEMPRO c MEMDERDISP 


在 V9.1 上 ， 这 条 查询 的 访问 计划 采用 NLJOIN， 并 有 很 好 的 性 能 。 但 是 升级 到 V9.5 后 ， 
访问 计划 不 再 使 用 NLJOIN， 而 是 使 用 HSJOIN， 人 性 能 明显 下 降 。 
2. 诊断 分 析 
下 面 是 具体 的 诊断 分 析 步 骤 。 
CD 对 比 V9.1 和 V9.5 下 的 访问 计划 
在 V9.1 上 ， 使 用 NLJOIN 的 访问 计划 如 下 所 示 ，NLJOIN 操作 的 成 本 为 3054.7。 


ROWS 
RETURN 
( 1) 
(oS 
I/O 
| 
2092.-01 
TBSCAN 
a) 
3054., 88 
2052. 7 
| 
2092.-01 
SORT 
(3) 
3054,67 
2002 
| 
2892.01 
UNIQUE 
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( 


SUE 
2105 7 
| 
ICI NNI 
^NLJOIN 
( 5) 
3054.7 
2052.7 
Jc uus idee X 
I 05 1.58462 
TBSCAN FETCH 
( 6) (US) 
ee ETE IIIS 
e 0I 2 
| ed 
2 S OS 1.58462 83566 
SORT ELCAN TARLE ACTIE. 
(m ( 12) OA MEMPRO 
i055. 7.56216 Q3 
15/55 902 1 
| | 
1b) 2005 83566 
NLJOIN INDEX: SYSIBM 
(ES EE Om qu d567» TNT) 
1033.62 Q3 
15/5 00/2 
curie xdi x 
67.3508 ZINC 
IXSCAN IXSCAN 
MEE ( 10) 
I pco 
g 2 
| | 
3.55181e-06 3.55181e-*06 
ENDEX A TIVI rI ES TINDE: ACTIVI TUNES 
OA IX NODE 4 OA IX NODE 2 
92 Q1 


ft V9.5 b, EH HSJOIN 的 访问 计划 如 下 所 示 ，HSJOIN 操作 的 成 本 为 16179.9， 大 于 在 
V9.1 下 的 NLJOIN 操作 的 成 本 : 


Rows 
RETURN 
( 1) 
GOSE 
JE AO 
| 
1544.65 
TBSCAN 
(T) 
16181,6 
25388-96 
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1544.65 
SORT 
t 3] 
16181.4 
2588.98 
| 
1544.65 
^HSJOIN 
( 4) 
16179.9 
2588.98 
/[------------ £------------- Y 
365485 1544.65 
PETGCH NLJOIN 
(ED (7) 
14994.6 1095.61 
2444.39 144.583 
/[----*----N /[------- £------- Y 
365486 365486 diego 21.6667 
IXSCAN TABLE: ACTIVITIES IXSCAN IXSCAN 
( 6) OA MEMPRO ( 8) ( 9) 
973.719 Q3 irs 8 2 H0) 15.1752 
621.393 2 
| | 
365486 3.96802e406 3.96802e«06 
INDEX: INSTLCA TNIDEXI ACTPLVIPEPBS INDEX: INSTLCA 
IDX104061828550000 OA IX NODE 4 IDX104061828510000 


Q3 Q2 eu 


另外 ， 在 V9.5 上 ， 利 用 优化 概要 文件 定制 访问 计划 ， 并 测试 各 种 连接 操作 的 性 能 如 下 ， 
发 现 NLJOIN 操作 的 性 能 要 好 于 HSJOIN. 


NLJOIN - 0.39 seconds 
HSJOIN - 1.73 seconds 
MSJOIN - 1.66 seconds 


(20 从 索引 入 手 分 析 

Æ V9.5 E, 为 什么 优化 器 没有 选择 性 能 更 好 的 NLJOIN 呢 ? 这 是 问题 的 关键 所 在 。 再 深入 
分 析 ， 发 现 很 可 能 和 SQLII0316221740500 这 个 索引 有 关 ， 它 是 影响 优化 器 选择 NLJOIN 和 
HSJOIN 的 关键 因素 。 在 V9.1 的 NLJN 访问 计划 中 ， 正 是 使 用 这 个 索引 作为 内 表 的 索引 扫 朱 。 

接 下 来 ， 比 较 SQL110316221740500 这 个 索引 在 V9.1 和 V9.5 上 的 统计 信息 。 

V9.1 上 该 索引 的 统计 信息 如 下 所 示 ， 索 引 SQL110316221740500 有 具有 极 好 的 聚集 度 
(clustering) 和 密度 Cdensity?) ， 均 为 100。 


Schema: SYSIBM 


Name : 5$50L110316221740500 

Types Index 
Time of creation: 2011=03=16=22.17.40.501173 
Last statistics update: 
Number of columns: 1 
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Number of rows: 83566 
Well = 

Number of buffer pool pages: 1741 
Distinct row values: Yes 
Tablespace name: OAREGTABSPACE 
Tablespace overhead: 7.500000 
Tablespace transfer rate: 0.060000 


Source eon eS ee: 


Single Node 


Prefetch page count: 32 
Container extent page count: 32 
Index clustering statistic: 100.000000 
Index leaf pages: 175 

Index tree levels: 2 

Index full key cardinality: 83566 
Index first key cardinality: 83566 
Index first 2 keys Cardinality: =1 
Index first 3 keys cardinalirtys =í 
Index first 4 keys carcinalirtys =i 
Index sequential pages: 175 

Index page density: 100 

Index avg sequential pages: zu 


Index avg gap between sequences:-1 


Index avg random pages: zl 

Fetch avg sequential pages: =1 
Fetch avg gap between sequences:-1 
Fetch avg random pages: =1 

Index RID count: 0 

Index deleted RID count: 0 

Index empty leaf pages: 0 

Base Table Schema: ACTIVITIES 
Base Telle Names OA MEMPRO 


Columas in 工 让 可 全 到 5 


MEMBERID 


在 V9.5 上 ， 使 用 db2look 工具 导出 该 索引 的 统计 信息 ， 如 下 所 示 ， 索 引 的 聚集 度 和 密度 
都 很 差 . CLUSTERRATIO- 0.342662 和 DENSITY=42 。 聚 集 度 和 密度 较 低 说 明 索 引 的 页 面 在 物 
理 存 储 上 比较 分 散 ， 由 于 NLJN 访问 计划 需要 访问 此 索引 ， 优 化 器 认为 读 取 该 索引 的 页 面 需要 
更 多 的 IO， 因 此 成 本 较 高 。 这 是 V9.5 中 优化 器 没有 选择 NLJOIN 的 原因 。 


UPDATE SYSSTAT.INDEXES 

SET NLEAF-585, 
NLEVELS-2, 
FIRSTKEYCARD-365486, 
FIRST2KEYCARD--1, 
FIRST3KEYCARD--1, 
FIRSTAKEYCARD--1, 
FULLKEYCARD-365486, 
CLUSTERFACTOR--1.000000, 
CLUSTERRATIO- 0.342662, 
SEQUENTIAL PAGES-304, 
DENSITY-42, 
AVERAGE SEQUENCE GAP-0.000000, 
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AVERAGE SEQUENCE FETCH GAP--1.000000, 
AVERAGE SEQUENCE PAGES-585.000000, 
AVERAGE SEQUENCE FETCH PAGES--1.000000, 
AVERAGE RANDOM PAGES-0.000000, 
AVERAGE RANDOM FETCH PAGES--1.000000, 
NUMRIDS-365486, 
NUMRIDS DELETED-0, 
NUM EMPTY LEAFS-0, 
AVGPARTITION CLUSTERRATIO--1, 
DATAPARTITION CLUSTERFACTOR-1.000000, 
INDCARD-365486 

WHERE COLNAMES = '-«MEMBERID' 

AND TABNAME - 'OA MEMPRO' AND TABSCHEMA - 'ACTIVITIES'; 


3 解决 方案 


确定 了 根本 原因 后 ， 解 决 这 个 问题 就 比较 简单 了 ， 有 如 下 解决 方案 : 
CD 从 访问 计划 的 对 比 中 可 以 看 出 , KOA MEMPRO 的 基数 在 V9.1 中 显示 为 83566， 而 
在 V9.5 中 则 为 36$S486， 发 生 了 很 大 的 变化 。 索 引 的 统计 信息 也 显示 索引 叶子 页 面 数 从 175 变 
为 585， 但 是 索引 的 聚集 度 和 密度 变 得 很 差 。 这 说 明 V9.1 上 的 统计 信息 已 经 过 时 ， 而 升级 到 
V9.$， 用 户 仅 仅 使 用 RUNSTATS 更 新 了 统计 信息 ， 但 是 没有 做 REORG. 
因此 ,升级 到 V9.5 后 ,需要 使 用 REORG 命令 重组 这 些 表 和 表 上 的 索引 ,并 执行 RUNSTATS 
重 狐 收集 统计 信息 ， 从 而 得 到 性 能 更 好 的 NLJOIN 访问 计划 。 
(2) Æ V9.5 上 ， 可 使 用 如 下 的 优化 概要 文件 ， 为 该 查询 定制 NLJOIN 访问 计划 ， 从 而 获 
得 所 期 望 的 性 能 。 这 样 即 使 以 后 数据 发 生变 化 ， 该 查询 的 访问 计划 也 不 会 改变 。 
/ 7 <OPTCUIDELINES> 
«NLJOIN» 
NEIN 
NCCE SOERA ID= > 
<ACCESS TABID=" 01" /> 
se NERONE 
<ACCESS TABID=" 03" /> 


</NLJOIN> 
</OPTGUIDELINES>*/ 


[2 “心得 分 享 : 哪怕 一 个 不 起 眼 的 统计 信息 也 会 影响 优化 器 所 做 的 选择 ， 从 而 导致 大 的 性 


9.3.5 ”案例 5: A ETE RES BUS 


1. 问题 描述 


客户 报告 了 这 样 一 个 性 能 问题 : 在 DB2 V9.7 上 执行 一 条 查询 语句 ， 用 到 了 两 个 表 的 连接 
操作 ， 其 中 表 PS PYMNT VCHR XREF 是 大 表 ， 记 录 数 为 6400000 行 ， 另 一 个 表 
PS PYCYCL 01 TMP6 是 小 表 ， 记 录 数 为 13678 行 。 如 果 对 大 表 启 用 压缩 ， 则 这 条 语句 执行 起 
来 需要 304b MRR, MAAN Im 0.8 秒 。 
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AR — BC fr: 
SELECT 
FROM 
pqys.PS_PYMNT_VCHR_XREF A , pqys.PS_PYCYCL 01 TMP6 B 
WHERE 
BPAY CYCLE 三 COMORA 
AND B PAY CYCLE SEQ NUM = 169 
AND B.SOURCE TXN = "VCAR' 
AND SEMI ES 
AND A- BUSINESS UNIT = UN 
AND A.VOUCHER ID = B.PAY DOC ID 
AND A -PYMNT_ CNT = B. PAY DOC SEQ with C$; 


使 用 db2batch 测试 这 条 碍 询 在 大 表 压 纵 和 未 压缩 两 种 情况 下 的 性 能 ， 如 下 所 示 : 
对 大 表 压 缩 : 


x 5 rows) fetched, EE OW S) S Output. 


* Prepare Time is: 0.023439 seconds 

* Execute Time is: 1938.740764 seconds 

* Fetch Time is: 0.000084 seconds 

* Elapsed Time is: 1938.764287 seconds (complete) 
对 大 表 不 压缩 : 


*» 5 FOW(S) fetened, E OI S Output. 


* Prepare Time is: 0-025502 seconds 
* Execute Time is: 0.081455 seconds 
* Fetch Time is: 0.000083 seconds 
* Elapsed Time is: 0.106840 seconds (complete) 


2. 诊断 分 析 

下 面 是 具体 的 诊断 分 析 步 又 。 

(1) 对 比 访 问 计 划 

对 大 表 不 压缩 的 访问 计划 如 下 所 示 ， 使 用 NLJOIN 做 连接 操作 : 


Access Plan: 
wortal Costs 225837 


Query Degree: 1 


Rows 
RETURN 
( 1) 
COST 
I/O 
| 
13677 
^NLJOIN 
(T) 
225037 
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139668 
/---------------- +----------------- Y 
13677 1 
IXSCAN PETCH 
(3) (4) 
146.934 Zo 1307 
83 
| /----+----\ 
13678 1 6.42044e+06 
HDPC OMS IXSCAN JADbhRI BOYS 
PSCPYCYCL UL TMPBG6 ( 5) PS PÝMNT YVCHR XREF 
(I 15.163 Q2 


2 


| 
6.42044e*06 
INDEX: PQYS 
PS PYMNT VCHR XREF 
Q2 


XI AGAR Hs A8 HRA P Pro. BEH HSJOIN 做 连接 操作 : 


Access Plan: 


Total Cost: 84942 .9 


Query Degree: 1 


ROWS 

RETURN 

DEEP) 

COSE 

I/O 
| 

13677 

HSJOIN 

( 42] 

G4 922 9 

55354 

/--------------------- +------------------ \ 
6.42044e+06 L13677 
TBSCAN IXSCAN 
(a) (C) 
102718-6 146,934 
55271 83 
| | 
6.42044e-06 13678 
JA TSIS RS PO TENUIS SEIS 
PS PYMNT VCHR XREF PSCPYCYCL OQ TMPG 

Q2 o 


(20 对 比 语句 快照 
在 大 表 未 压缩 的 情况 下 ， 执 行 查询 (NLJOIN) 的 语句 快照 如 下 所 示 : 
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Statement start timestamp = 10/04/2012 163233523.387481 
ROP Or POV OOE 


Statement stop timestamp 


Total Statement user CPU time = 0.042662 
Total Statement system CPU time = 0.000433 
SOL compiler cost estimate in timerons = 312218 
SQL compiler cardinality estimate = 13677 
Rows read = 13684 

Rows fetched = 5 

Buffer pool data logical reads = 1883 
Buffer pool data physical reads = 1 

Buffer pool temporary data logical reads = 0 
Buffer pool temporary data physical reads = 0 
Buffer pool index logical reads = 41034 
Buffer pool index physical reads = 11 
Buffer pool temporary index physical reads = 0 


在 大 表 压 缩 的 情况 下 ， 执 行 查 询 (HSJOIN) 的 语句 快照 如 下 所 示 : 


Statement start timestamp = 09/12/2012 13;43:39.8039352 
Statement stop timestamp = 09/12/2012 14315:58.587003 
Total Statement user CPU time = 1231.349916 

Total Statement system CPU time = 0.007016 

SQL compiler cost estimate in timerons = 84943 

SQL compiler cardinality estimate = 13677 

Rows read = 6420441 

Rows fetched = 5 

Buffer pool data logical reads = 183439 

Buffer pool data physical reads = 0 

Buffer pool temporary data logical reads = 0 

Buffer pool temporary data physical reads = 0 

Buffer pool index logical reads = 85 

Buffer pool index physical reads = 0 

Buffer pool temporary index physical reads = O 


使 用 HSJOIN 的 访问 计划 用 到 的 CPU 时 间 为 1231 秒 ， 超 过 20 分 钟 。 

(3) HSJOIN 连接 字段 类 型 不 一 致 

于 是 进一步 分 析 HSJOIN 操作 符 的 谓词 ， 发 现 谓 词 Q2.VOUCHER ID = QI.PAY DOC ID 
竟然 是 residual 谓词 。 在 4.5.2 节 讲 到 ，residual 谓词 的 处 理性 能 是 最 差 的 ， 在 使 用 HSJOIN 连 
接 后 才 需 要 计算 这 个 谓词 。 


2) Predicate used in Join 


Comparison Operator: Equal (=) 
Subquery Input Required: No 
Filter Eactor: 00.0078125 


Predicate Text: 


384 


$94 SOL4&Aàwwexx AN 


(Q2.PYMNT CNT - Q1.PAY DOC SEQ) 


3) Residual Predicate 


Comparison Operator: Equal (=) 
Subquery Input Required: No 
Pilter rFactor: 2. 152226e=07 


Predicate Text: 


(Q2.VOUCHER ID = Q1.PAY DOC ID) 


4) Predicate used in Join 


Comparison Operator: Equal (=) 
Subquery Input Required: No 
Eiltor Factor: 00.0769231 


Predicate Text: 


(92 -BUSINESS UNIT = Q1.BUSINESS_ UNIT) 

最 终 ， 从 表 的 定义 中 发 现 , 字段 VOUCHER ID 的 类 型 为 CHAR(8)， 而 字段 PAY DOC ID 
的 类 型 为 CHAR(20)， 尽 管 类 型 一 致 ， 但 是 长 度 不 同 。 在 HSJOIN 中 ， 要 求 连 接 谓词 的 两 个 字 
段 类 型 〈 包 括 长 度 ) 完全 一 致 ， 这 便 是 问题 的 根源 。 

3. 解决 方案 

将 字段 VOUCHER ID 的 类 型 定义 从 CHAR(8) 调 整 为 CHAR(20), 即 和 了 PAY DOC ID 的 类 
型 以 及 长 度 完 全 一 致 ， 这 样 优 化 器 就 可 以 在 访问 计划 中 选择 HSJOIN 了 。 调 整 后 ， 这 个 查询 只 
需要 0.6 秒 就 能 得 到 结果 ， 比 NLJOIN 的 0.8 秒 还 要 好 ! 
利口 项 芭 得 分 享 ; 连接 谓词 的 类 型 匹配 对 HSJOIN 非常 重要 。 在 一 次 国内 ERP 系统 的 SQL 调 

优 中 ， 发 现 一 个 VARCHAR(20) 列 与 CHAR(20) 列 做 连接 导致 了 严重 的 性 能 问题 。 将 类 

型 改 成 一 致 后 ， 访 问 计 划 由 NLIOIN 改 为 了 HSJOIN， 执 行 时 间 从 30 分 钟 以 上 减少 到 

3 


9.3.6 ”案例 6: 居 高 不 下 的 CPU EAX 
1. 问题 描述 


到 十 的 一 家 银行 客户 对 业务 数据 库 进 行 了 改造 ， 评 加 了 一 些 表 ， 并 导入 了 一 些 数据 ， 重 新 
执行 过 reorg 和 runstats 后 ， 按 照 计 划 上 线 后 发 现 了 一 个 性 能 问题 : 当 系 统 忙 时 ，db2sysc 进程 
的 CPU 占用 率 居 高 不 下 ， 啊 应 速度 也 越 来 越 慢 。 

2. 诊断 分 析 


下 面 是 具体 的 诊断 分 析 步 又 。 
(1) 首先 对 操作 系统 进行 监控 ， 获 取 性 能 数据 。 如 下 所 示 ，CPU FHIR, mHE 
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是 用 户 CPU (user cpu) ， 占 到 90% 左 右 。 


vmstats 命令 的 输出 如 下 : 


System configuration: lcpu-16 mem-32768MB ent=0.40 


ata memory page lsats CI 

r b avm fre re pi pO fr şs Cy 1n Sy Cs us sy id wa PDE ec 

18 0 6667113 743374 0 0 0 0 0 © 71 364428 178594 90 9 0 0 3.99 997.7 

80 0 6667654 742827 0 0 0 0 0 © 80 443531 177407 &7y 13 0 0 3.99 997.2 

80 0 6667150 743328 0 0 0 0 0 © 74 349676 161759 8 11 0 0 3.99 997.7 

719 0 66067216 743258 0 0 0 0 0 © 66 382124 173518 %0 10 0 0 3.99 997.7 

80 0 6667368 743098 0 0 0 0 0 © 81 409346 140119 &3 12 0 0 3.97 991.7 

716 0 66067193 743270 0 0 0 0 0 © 51 371598 182898 &9 11 0 0 3.99 996.9 

78 0 6667149 743309 0 0 0 0 0 © 66 468944 197713 &7 13 0 0 3.99 997.4 

79 0 6667115 743338 0 0 0 0 0 © 95 405266 201333 &7 13 0 0 3.98 994.7 

80 0 6666900 743521 0 0 0 0 0 0 155 369984 179370 39 11 0 0 3.99 998.1 

82 0 6667440 742976 0 0 0 0 0 0 138 376950 1846825 36 12 0 0 3.96 990.3 
nmon shows: 
Time PID %CPU $Usr $S9ys Threads Size ResText ResData CharlO %RAM Paging Command 
10:10:50 142068864 155.5 1154.26 4.27 131 110180 140 110004 487194 0 112 db2sysc 
10:11:50 14266884 135.685 160,52 5:51 131 110180 140 110004 368515 0 0 db2sysc 
10:12:51 14286884 208.09 202.61 5.48 107 110180 140 110004 400880 0 0 db2sysc 
10:13:51 14286684 l62.5 153.145 4.35 107 110180 140 110004 359077 0 0 db2sysc 
10:14:51 14286884 155.39 151.08 4.3 107 110180 140 110004 388350 0 0 db2sysc 


10:15:51 14266864 119 MS Ee 6 E23 110180 140 110004 4135983 0 107 db2sysc 


(2) 分 析 数 据 库 快照 
如 下 所 示 , 使 用 CPU 最 多 的 是 一 个 名 为 MDSECURE.GetAllBindsByUser 的 存储 过 程 调 用 ， 
共 发 生 196 次 调用 ， 用 户 CPU 时 间 占 用 6847 Rb, 接近 2 个 小 时 ,平均 每 次 调用 耗 时 71 89. 23 
外 , 由 这 个 存储 过 程 导 致 的 索引 读 次 数 竟然 达到 了 4503695455 次 ! 正 是 由 于 这 么 惊人 的 索引 读 
次 数 导 致 了 CPU 使 用 率 过 高 。 


Number of executions = 196 
Number of compilations = 1 
Worst preparation time (ms) = 18 


Best preparation time (ms) = 


Internal rows deleted = 0 
Internal rows inserted = 0 
Rows read = 1714 
Internal rows updated = 0 
Rows written = 0 
Statement sorts = 132 
Statement sort overflows = 0 
Total sort time = 0 
Buffer pool data logical reads = 1716 
Buffer pool data physical reads = 23 
Buffer pool temporary data logical reads = 0 
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Buffer pool temporary data physical reads = 0 

Buffer pool index logical reads = 4503695455 

Buffer pool index physical reads  - 11000 

Buffer pool temporary index logical reads = 0 

Buffer pool temporary index physical reads = O 

Buffer pool xda logical reads = 0 

Buffer pool xda physical reads = 0 

Buffer pool temporary xda logical reads = 0 

Buffer pool temporary xda physical reads = 0 

Total execution time (sec.microsec)= 5948.129121 

Total user cpu time (sec.microsec) = 6847.494026 

Total system cpu time (sec.microsec)= 32.953288 

Total statistice fabrication time (milliseconds) = Q0 

Total synchronous runstats time (milliseconds) = 0 
Statement text = call MDSECURE.GetAllBindsByUser(?,?) 
Sie SE. Type = Static SQL Statement 
Statement = Fetch 

Section number = 1 

Application creator = MDSECURE 

Package name = P5595591 


Consistency Token = 

Package Version ID = 

Cursor name —- C1 

Statement database partition number = 0 

01/22/2013 10512832.362211 


Statement start timestamp 
Statement stop timestame = 


Elapsed time of last completed stmt (sec.ms)= 0.000105 


Total Statement user CPU time = 145,79606068 
Total Statement system CPU time = 10.135695 
SOL compiler cost estimate in timerons = 2 

SOL compiler cardinality estimate = 1 

Buffer pool data logical reads = 29 

Buffer pool data physical reads = 

Buffer pool temporary data logical reads = 0 

Buffer pool temporary data physical reads = 0 

Buffer pool index logical reads = 18631760 


继续 退 踪 MDSECURE.GetAlIIBindsByUser 存储 过 程 中 定义 游标 C1 的 这 条 SQL 语句 , 如 下 
所 示 ， 这 条 SQL 在 表 desktops 和 bindings 之 间 做 连接 : 


SELECT me ne ee ip address, sco ç 
b pmid, © art type 
FROM ( 
SELECT d. pmid AS @ pmid, @. ip address as Gd ip address; sso p 


b pmid. AS b pmid, b. drt type AS b ot type, 
FROM MDSECURE.desktops d LEFT JOIN MDSECURE.bindings pb 
ON (b.pmid = d.pmid) 
WE 0.delece flag IS NULL AND bo.dre tCype<>'T" AND b userID = ? 
order by b.LASTMODIFIED desc) as cur 
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where 10 > 
(select count(*) 
crom ( 
SELECT Gm cM @a pmid, c. ip address AS @ ip adlad Beso M p 
b- pmid AS b pmid, b at type AS b 9 IENZIOXSE 
FROM MDSECURE.desktops d LEFT JOIN MDSECURE.bindings b 
ON (b -pmid = dep 
WHBRE ©. delete flag 1S NULL AND dors ole tCype<>"T" AND b userID = ? 
order by b.LASTMODIFIED desc) as c 


where c.lastmodified > cur.lastmodified) 


获取 这 条 SQL 语句 的 访问 计划 ， 如 下 所 示 ， 两 个 表 上 的 扫描 都 用 到 了 索引 ， 忆 成 本 为 


366.3$8， 这 个 值 在 合理 范围 内 ， 


Access Plan: 


Total Cost: 366.358 


Query Degree: 1 


访问 计划 也 并 没有 什么 不 受 。 


Rows 
RETURN 
E 
COSE 
I/Q 
| 
2.15702 
NLJOIN 
2 
3606.358 
61.2907 
/------------ +------------ N 
96.47106 Dcos 0 955 
^NLJOIN PLLTER 
0 E) 
ZO SITO 113.426 
37-1859 24.1128 
/------ +------- \ | 
6.47113 0.999989 1 
TBSCAN PETC EI GRBEBY 
i. v) e» (- 159) 
AA 5396 32.16 IUIS 42.5 
17.6417 3 -02021 24.1128 
| /---+----\ | 
6.47113 0.999989 7.34515e-«06 SU 2353553 
SED IXSCAN TABLE: MDSECURE TBSCAN 
( 5) ( 11) DESE OKORS ( 14) 
AA 5349 21.3007 Q6 TUS ed aS 
17.6417 2 24.1126 
| | | 
6.47113 1.34515e+06 站 2 
TE TER DITE INDEX: MDSECURE SORA 
( 6) PKR DESKTOPS ( 15) 
AA ISAS Q6 MOTAS 
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ERAI DUNS 
/---+----\ | 
6.48247 72821 26-016 3 5 
[SPD CIN TABLE: MDSECURE ^NLJOIN 
Oo BINDINGS ( 16) 
21 $055 Q7 113.4259 
2 2 NND 
| /--------- +--------- Y 
6.48247 3.23557 0.999989 
SOIRE PETCH IXSCAN 
( 8) ( 17) QE) 
21.3048 44.5319 23t- S003 
2 19-529 2 
| /---+----\ | 
6.48247 6.48247 7.28217e406 7.34515e406 
IXSCAN ED ON TABLE: MDSECURE INDEX: MDSECURE 
( 9) ( 18) BINDINGS BE ES 
21.3039 21.3052 Q2 Q1 
2 2 
| | 
7.28217e406 6.48247 
INDEX: MDSECURE SORT 
BINDINGS USERID ( 19) 
Q7 21.3048 
2 
| 
6.48247 
IXSCAN 
( 20) 
21.3039 
2 


7.28217e+06 
INDEX; MDSECURE 
BINDINGS USERID 
02 


(3) 分 析 存 储 过 程 的 访问 计划 
什么 地 方 不 对 劲 呢 ?” 怀 着 这 种 疑问 ， 使 用 db2expln 命令 打印 出 了 这 个 存储 过 程 〈 包 名 为 
P5595591) 的 访问 计划 ， 如 下 所 示 〈( 关 于 打印 方法 ， 请 参考 9.2.1 8D: 


cdio2expln anss olo =e MDSECURE =p 15595591 en 


于 是 ， 看 到 了 最 开始 的 那儿 行 ， 寻 思 这 2012 年 都 快 过 去 了 ， 而 这 个 存储 过 程 的 bind 时 钟 
还 停留 在 2010 年 ， 如 下 所 示 。 


ACkCkCk ck Kock ck ck ck ck ck k k ck k kkk* PACKAGE 大 大 大 大 大 大 大大 类 大 类 大大 大 类 大 大 大 大 大 大 大 大 大 大 大 大 大 类 类 大 类 类 类 类 类 类 大大 


Package Name "MDSECURE"."P5595591" Version - "" 


ZOO 2. 3) 
I7: 54348 


Prep Date 


Prep Time 
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Bind Timestamp = 2010-02-27-17.54.46.372606 


使 用 如 下 的 rebind 命令 重新 绑 定 这 个 存储 过 程 ， 然 后 CPU 使 用 率 回 到 正常 水 平 ， 一 切 归 
于 平静 | 


rebind package MDSECURE.P559559] resolve any; 


BUE 


CALL SYSBROC .REBIND ROUTINE PACKAGE qude re "MDSECURE GetAllBindsByUser", REESE ) 5 


上 口 请 5 得 分 享 :数据库 性 能 问题 的 外 在 表现 与 根源 ， 有 时 似乎 扯 不 上 关系 。 可 能 是 因为 时 
间 久 了 被 总 了 ,也 可 能 是 用 户 不 经 意 间 执行 了 某 个 命令 (例如 ,执行 了 reorg 和 runstats， 
旦 是 所 了 执行 rebind )， 最 终 性 能 问题 悄然 而 至 。 


9.4 mk SQL 语句 应 用 


作为 数据 库 奏 询 语 言 ，SQL 语言 的 能 力 非 第 强大 ， 除 了 提供 基本 的 但 询 、 增 加、 更 新 和 删 
除 功 能 语句 外 ， 还 有 一 些 避 级 功能 。 有 时 候 需 要 多 条 基本 SQL 语句 才能 完成 的 功能 ， 仅 用 一 条 
局 级 SQL 语句 束 非 常 方 便 地 完成 了 ， 而 且 性 能 更 局 。 本 节 将 介绍 一 些 这 样 的 融 级 SQL 语句 ， 
如 果 运 用 得 当 ， 必 能 在 性 能 优化 中 发 挥 举 足 轻重 的 作用 。 


9.4.1 Merge 语 铝 


在 数据 仓库 应 用 中 ， 很 多 开发 人 员 在 开发 ETL CExtract-Transform-Load 的 缩写 ) 脚本 时 ， 
会 过 到 一 种 常见 需求 :将 一 个 源 表 的 数据 合并 到 男 一 个 目标 表 中 。 按 照 一 般 的 思路 ， 实 现 该 需 
求 至 少 需 要 UPDATE 和 INSERT 两 条 SQL 才能 完成 ， 而 且 性 能 也 不 怎么 好 。 这 个 时 候 ， 束 可 
以 发 挥 Merge 语句 的 威力 了 。 
下 面 举 一 个 数据 仓库 中 的 例子 来 说 明 ， 其 中 涉及 的 表 有 两 个 ， 分 别 是 源 表 purchase 和 目标 
K inventory， 它 们 的 DDL 定义 和 初始 化 数据 如 下 所 示 : 
CREATE TABLE purchase( 
prod id INTEGER NOT NULL PRIMARY KEY, 
prod name VARCHAR(20) NOT NULL, 


e E aE O O, 
qty INTEGER NOT NULL); 


CREATE TABLE inventory( 
proc ic) INTEGER NOT NULL PRIMARY KEY, 
prod name VARCHAR (20) NOT NULL, 
qty INTEGER NOT NULL); 
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INSERT INTO purchase (proc sol. prod name, price, Sy) 


VALUES 
(101, “IPacd4", 1599.00, 2000), 
(103, "IPhone", 4299-00; 1800), 
(203; "Galaxy Note II"; 3699.00, 2500), 
(301; “TaLnkPac", 4688-00; 500) 7 


INSERT INTO inyentory (proci ic, prot name, Gty) 


VALUES 
(101; “IPad! , 800), 
(102, TE EDS Ona tee) m qox 
(201; scc 2000) ; 
(301, “ThinkPad”, 300), 
(401, "Kindle", 1400); 


现在 需要 将 purchase 表 的 数据 合并 到 inventory 表 ， 换 句 话说 ， 如 果 purchase 表 的 prod id 
在 inventory 表 中 存在 ， 则 执行 更 新 操作 ， 即 将 qty 值 累加 ; 否则 ， 则 向 inventory 表 插 入 一 条 新 
WRK 

按照 一 般 的 思路 ， 实 现 该 需求 至 少 需要 UPDATE 和 INSERT 两 条 SQL 才能 完成 ， 示 例如 
下 ， 这 两 条 SQL 都 包含 子 查 询 ， 看 起 来 很 别扭 : 

UPDATE inventory i SET qty = qty + 


(SELECT qty FROM purchase where pro hob. = sb procl iel) 
WEBERE ipro) ic IN (SELECT proc ic! FROM purchase), 


INSERT INTO inventory (prod id, prod name, qty) 
SELECT p procl icd, p-prod name, p-aty FROM purchase p 
WHERE proa ic NOT IN(SELECT proa icd FROM Vento 


Merge WAR EENEN JRE A, K E, AEA” A 
辑 。 如 下 所 示 ， 使 用 Merge 语句 ， 一 条 SQL 就 能 解决 问题 ， 简 洁 高 效 : 


MERGE INTO inventory i 
USING Purchase P 

ONG (i proa id = p. proc icl) 
WHEN MATCHED THEN 

UPDATE SIM GEY 三 二 GEY + PQY 
WHEN NOT MATCHED THEN 

INSERT (proci ic, prot name, Qy) 

VALUES (p-prod id, p- proc _ name, P- ct 


上 面 的 例子 充分 展示 了 Merge 语句 的 能 力 。 在 DB2 F, Merge 语句 的 完整 语法 如 下 所 示 ， 
在 匹配 时 (WHEN MATCHED) 执行 UPDATE 或 DELETE， 在 不 匹配 时 (WHEN NOT 
MATCHED) 执行 INSERT: 


MERGE INTO target table 
USING source table 
ON search=concition 
WHEN MATCHED [AND additional condition] THEN 
UPDATE / DELETE 
WEEN NOT MATCHED [AND aceditional condicion] THEN 
INSERT p 
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A tE: Merge 中 源 表 和 目标 表 | 
Merge 中 源 表 和 目标 表 的 定义 并 不 要 求 完 全 一 致 ， 上 例 中 ，purchase 和 inventory 表 
结构 也 不 完全 一 致 。 另 外 ， 也 不 要 求 是 基本 表 ， 可 以 是 子 查 询 或 视图 。 


为 了 更 深入 理解 Merge 语句 ， 下 和 面 再 举 儿 个 例子 。 
C15 匹配 时 ， 更 新 目标 表 。 


MERGE INTO inventory i 


USING purchase p 
ON (i proc id = p -proci ial) 
WHEN MATCHED THEN 
UPDATE SET i.qty = i.qty + p.qty; 


(2) 匹配 时 ， 删 除 目标 表 中 匹配 的 行 。 


MERGE INTO inventory i 
USING Purchase P 
ON (i proc icd = p -proc ial) 
WHEN MATCHED THEN 
DELETE ; 


a 注 意 : Merge 语句 中 的 DELETE 
DELETE 语 甸 只 能 删除 目标 表 的 记录 ,无 法 删除 源 表 。 在 此 例 中 , 如 果 要 删除 purchase 
表 的 记录 ， 可 以 将 chase 作为 Merge 语句 的 目标 表 ， 或 者 直接 用 DELETE 语句 删除 。 


(3) 不 匹配 时 ， 回 目标 表 插 入 新 行 。 


MERGE INTO inventory i 
USING (SELECT proci ic, proc name, ene EROM purchase) 19 
ON (i proc) id = p -proc id) 
WHEN NOT MATCHED THEN 
INSERT (prod id, prod name, qty) 
YALUES (p-proc_ icd, p- proc neame, pP €ty) 5 


(4) 在 匹配 或 不 匹配 子 句 中 加 入 额外 条 件 。 


MERGE INTO inventory i 
USING Purchase P 
ON (i pro icd = 人 -DECOd idl) 
WHEN MATCHED AND i.qty <=500 THEN 
UPDATE IDE um scu F+ PQY 
WHEN MATCHED AND (i.qty >500 or p.qty >=1000 ) THEN 
UPDATE SET i.qty - MIN(i.qty * p.qty, 2000) 
WHEN NOT MATCHED THEN 
INSERT (proci ic, proc name, Qty) 
YALUES (P- proci ic, ppro name, Po aty) 
ELSE ITGNORE; 


9.4.2 次 查询 和 SQL 递归 
很 多 用 户 在 平时 的 工作 中 ， 经 党 遇 到 层次 模型 (hierarchical model， 狭 义 上 称 为 树 型 结构 ) 
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的 数据 ， 比 如 公司 组 织 结构 、 产 品 分 类 等 ， 那 么 怎么 使 用 SQL 语句 对 其 进行 得 询 呢 ? 
答案 是 SQL X&!H, DB2 文 持 下 面 两 种 递归 方式 来 实现 层次 租 询 : 
e CONNECT BY: 与 Oracle 兼容 的 递归 语法 ， 从 DB2 V9.7 开始 文 持 。 
e With 递归 : 用 With 子 句 实现 递归 ， 这 是 SQL 标准 的 语法 ，Oracle 直到 11g R2 才 开始 
支持 With 递归 。 
本 节 以 某 公司 组 织 结构 的 层次 数据 为 例 ， 分 别 讲解 上 述 两 种 递归 方式 的 用 法 。 如 下 所 示 ， 
这 个 公司 组 织 机 构 的 数据 存放 在 员工 表 EMPLOYEE 中 ， 下 而 是 它 的 DDL 定义 ， 其 中 字段 
MGRNO 用 于 构成 层次 模型 ， 从 下 面 的 输出 中 可 以 看 到 最 项 级 的 管理 者 为 Ginni。 
CREATE TABLE HR.EMPLOYEE( 
EMPNO INTEGER NOT NULL PRIMARY KEY, 
NAME VARCHAR (10) NOT NULL, 


SALARY DECIMAL(9, 2) NOT NULL, 
MGRNO INTEGER); 


INSERT LNTO HR AMPLO EE VALUTS 


(人 90000; NULL) ; 
(ein 60000, 1), 
( 3p "KIM; 60000; 1), 
( 4, "Jonh", 50000, 1), 
(5 3 Ma kety 42000; 297 
( ©; "Smith", 40000, 2), 
EU NUUS 36000， 2); 
(8, 'Eileen', 34000; E 
( 9, "Joe"; 33000; 3), 
(Loy  UHemps / 33000, S 
(11i, "Streven", 32000; 9), 
(2 PE gc 30000; 9), 
(13, 'Hayes', 50000, 4); 
(d tod 48000, 4), 
(15, mM obe 36000, 13); 
(16, "Srtrone", 38000; 13) 2 


1. FH CONNECT BY 递归 语句 实现 


从 DB2 V9.7 开始 ， 可 以 使 用 CONNECT BY 递归 ， 但 是 需 


COMPATIBILITY VECTOR=08， 并 重启 数据 库 ， 如 下 所 示 。 


@lle s ME OS 


db2stop 
028Eart 


YN 注意 : Oracle 兼容 库 和 Oracle 


要 设置 注册 变量 DB2 


在 DB2 中 ， 使 用 某 些 Oracle 兼容 语法 并 不 需要 重建 数据 库 ， 只 需 设 置 DB2 
COMPATIBILITY VECTOR 中 相应 的 位 (bit) 并 重启 db2 即 可 。 但 是 如 果 要 使 用 DB2 
支持 的 Oracle 所 有 特性 ， 特 别 是 Oracle 兼容 的 类 型 ， 需 要 设置 DB2 COMPATIBILITY - 
VECTOR-ORA 后 重启 db2， 然 后 新 建 的 数据 库 才 具有 Oracle 兼容 特性 。 
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先 看 一 下 CONNECT BY 递归 的 语法 格式 ， 如 下 所 示 ， 其 中 START WITH 用 来 指明 递归 的 
初始 条 件 ，CONNECT BY 子 句 表示 递归 关系 , 可 以 用 PIROR 关键 字 来 指定 上 一 层 递 归 中 的 列 ， 
如 PRIOR EMPNO = MGRNO， 即 上 一 层 递 归 中 的 EMPNO 等 于 当前 行 的 MGRNO. 


EC NEVO a Ne NINE CINE ME RUE 
FROM table name 


START WITH search-condition 
CONNECT BY | NOCYCLE ] PRIOR column = column 
MORDIERN COE 


在 CONNECT BY 的 层次 查询 中 ， 还 可 使 用 如 下 伪 列 、 函 数 和 子 句 : 

e LEVEL 伪 列 : ^ rEEX RW PBHJEZR, TR AI LEVEL 为 1. 

e CONNECT BY ROOT 伪 列 :层次 答 询 中 的 根 和 点 。 

e SYS CONNECT BY PATH 函数 : 根 节 点 到 当前 节点 的 路 径 。 

e ORDER SIBLINGS BY FAJ: 对 同一 父 市 点 下 的 所 有 子 市 点 按 某 字段 排序 。 

下 面 举例 说 明 。 

(1) 查询 “Kim” 经 理 下 的 所 有 员工 ， 如 下 所 示 ， 使 用 ORDER SIBLINGS BY FAJE 
EMPNO 字段 排序 : 


SELECT EMPNO, NAME, SALARY, LEVEL, 
CONNECT BY ROOT NAME AS ROOT, 


SUBSTR(SYS CONNECT BY PATH(NAME, '/'), 1, 25) AS PATH 
EXSOOMISEIESSBSNBE I COSA SS 
START WITH NAME - 'Kim' 


CONNECT BY PRIOR EMPNO - MGRNO 
ORDER SIBLINGS BY EMPNO; 


EMPNO NAME SALARY LEVEL ROOT PATH 
3 Kim 60000.00 1 Kim /Kim 
9 Joe 33000.00 2 Kim /Kim/Joe 
11 Steven 32000.00 3 Kim /Kim/Joe/Steven 
12 Jane 30000.00 BK /Kim/Joe/Jane 
10 Henry 33000.00 2 Kim /Kim/Henry 


5 record(s) selected. 


(2) ünN um fr "Gin" AAF, s 3 级 组 织 结构 并 只 返回 SALARY > 40000 
的 员工 ， 所 使 用 的 语句 如 下 所 示 ， 从 输出 可 以 看 出 CONNECT BY 采用 深度 优先 搜索 : 


SELECT EMPNO, NAME, SALARY, LEVEL, 
CONNECT BY ROOT NAME AS ROOT, 


SUBSTR(SYS CONNECT BY PATH(NANE 7/ I 2o) AS PATH 
HRONETEAEMEIRONAEE 


WHERE SALARY > 40000 AND LEVEL < 4 
START WITH NAME = 'Ginni' 
CONNECT ODY PEEOBR ESMENO — MGRNO 


EMPNO NAME SALARY LEVEL ROOT PATH 
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1 Ginni 90000.00 1 Ginni /Ginni 

2 Tom 60000.00 2 Ginni /Ginni/ Tom 

5 Mike 42000.00 SI Gato /Ginni/Tom/Mike 

53 Kim 60000.00 2 Ginn /Ginni/Kim 

4 Johh 50000.00 2 Ginni /Ginni/Johnh 

13 Hayes 50000.00 3 Ginni /Ginni/Johh/Hayes 
BAL cott 43000.00 3 Ginni Gin 


7 record(s) selected. 


(3) EWR "Stone" WAH, UKENE, AWE BW: 


SELECT EMPNO,; NAME, LEVEL, 
OUD TR (oS CONNECT IEY ESAE /2 PATE 
ESOS SB IB us 
START WITH NAME = 'Stone' 
CONNISCIUDYCEMPNOCOPPBIORSMGERNO 
ORDRENE 


EMPNO NAME LEVEL PATH 
16 Stone 1 /Stone 
13 Hayes 2 /Stone/Hayes 
4 Johh 3 /Stone/Hayes/Johh 
1 Ginni 4 /Stone/Hayes/Johh/Ginni 


4 record(s) selected. 


(40 üu Am xEfrWg "Kim" AH PIE DT và LIEST EA, TH AH P Bh: 


SELECT SUM(SALARY) FROM 
(SELECT EMPNO, NAME, SALARY 
FROM HR.EMPLOYEE 
START WITH NAME = 'Kim' 
CONNECT BY PRIOR EMPNO = MGRNO) 


1856000. 00 


1 record(s) selected. 


2. With #19 


With 递归 与 CONNECT BY 实现 递归 的 基本 原理 是 一 样 的 ， 区 别 在 于 它 使 用 UNION ALL 
来 连接 递归 的 初始 条 件 和 迭代 步 又。 
下 面 讲 解 如 何 使 用 With 递归 实现 上 面 CONNECT BY 语句 同样 的 查询 功能 。 
(1) 人 查询 经 理 “Kim” 下 的 所 有 员工 ， 语 句 如 下 所 示 : 


WITH T(empno, name, salary, level, root, path) AS 
( SELECT empno, name, salary, 1, 


name as root, 
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verme t |I name, 25), 
FROM HR.EMPLOYEE 
WHERE NAME = 'Kim'  -- 递归 初始 条 件 ， 相 当 于 START WITH 
UNION ALL 


SELECT e.empno, e.name, e.salary, 


t.level + 1, -- 构建 LEVEL 
OP -- 构建 RooT， 相 当 于 CONNECT BY ROOT 
t.path || '/' || e.name -- 构建 PATH， 相 当 于 SYS CONNECT BY PATH 


FROM T, HR.EMPLOYEE e 

WHERE t.empno = e.mgrno -- 递归 步骤 ， 相 当 于 CONNECT BY 
) 
SELECT S PROM Ts 


EMPNO NAME SALARY LEVEL ROOT PATH 


SOh0S47W The recursive common table expression "DB2INST1.T" may contain an 
infinite loop. SOLSTATE=01605 


3 Kim 60000.00 Trin /Kim 

9 Joe 33000.00 2L bw. / Kim/Joe 

10 Henry 33000.00 2 Kim /Kim/Henry 

11 Steven 32000.00 3 Kim /Kim/Joe/Steven 
12 Jane 30000.00 3 Kim /Kim/Joe/Jane 


5 record(s) selected with 1 warning messages printed. 


A 人 i 注 意 : 善意 的 无 限 循环 警告 
使 用 With 递归 时 ，DB2 Tå EAE SQL0347W 警告 ， 这 意味 着 递归 公共 表 表 达 式 
可 能 包含 无 限 循 环 。 如 果 层 次 数据 包含 环 (loop )， 那 么 递归 中 无 限 循 环 就 有 可 能 存在 。 
因此 ， 当 收 到 SQL0347W 这 个 善意 警告 时 ， 需 要 检查 一 下 是 否 会 导致 无 限 循环 。 


(2) 如 果 需 要 查询 从 “Ginni” 经 理 开 始 ， 只 需 3 级 组 织 结构 并 只 返回 SALARY > 40000 
的 员工 ， 所 使 用 的 语句 如 下 所 示 ， 从 输出 可 以 看 到 WITH 递归 采用 广度 优先 搜索 : 


WITH T(empno, name, salary, level, root, path) AS 
( SELECT empno, name, salary, 1, 
name as root, 
omen || name, 25) a Bath 
FROM HR.EMPLOYEE 
WHERE NAME = 'Ginni' 
UNION ALL 
SELECT e.empno, e.name, e.salary, 
jp c UU + 1; ceo ot E Danh Il "7 I] e -name 
FROM T, HR.EMPLOYEE e 
WHERE t.empno = e.mgrno and e.SALARY > 40000 and level < 4 
) 
SELECT * PROM Tè 


EMPNO NAME SALARY LEVEL ROOT PAJE 


SQL0347W The recursive common table expression "DB2INST1.T" may contain 
infinite loop. SQLSTATE-01605 
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1 Ginni 90000.00 1 Ginni /Ginni 

2 Tom 60000.00 2 Ginni /Ginni/Tom 

3 Kim 60000.00 2 Ginn /Ginni/Kim 

4 Johh 30000.00 2 Ginni /Ginni/Johh 

5 Mike 42000. 00 Cn /Ginni/Tom/Mike 
13 Hayes 50000.00 3 Ginni /Ginni/Johh/Hayes 
BAL cott 48000.00 3 Ginni GE 


7 record(s) selected with 1 warning messages printed. 


比较 : VG} ZR AS F 


CONNECT BY 递归 与 With 递归 在 搜索 ) 
而 With 递归 则 是 广度 优先 搜索 。 


页 序 的 区 别 是 : CONNECT BY 采用 深度 优先 搜索 ， 


(3) 答 询 员工 “Stone” 的 经 理 ， 以 及 整个 管理 链 ， 奋 询 语句 如 下 所 不: 


WITH T(empno, name, mgrno, level, path) AS 


( SELECT empno, name, mgrno, 


l, varchar("/" |] name, 25) as parch 
FROM HR. EMPLOYEE 
WHERE NAME = 'Stone' 
UNION ALL 


SELECT e€. empno, e- name, eE- MGENO, 
Eo leyel + 1, t -path || m || @.name 
FROM T, HR.EMPLOYEE e 
WHERE e.empno = t.mgrno 
) 
SELECT empno, name, level, path FROM T; 


SQOLO347W The recursive common table expression "DB2INST1.T" may contain an 
infinite loop. SQLSTATE-01605 


16 Stone 1 /Stone 

13 Hayes 2 /Stone/Hayes 

4 Johh 3 /Stone/Hayes/Johh 

1 Ginni 4 /Stone/Hayes/Johh/Ginni 


4 record(s) selected with 1 warning messages printed. 


(40 dum m frWg "Kim" AH PANA và LISTA RA, TH JH P Bn: 


WITH T(empno, name, salary) AS 
( SELECT empno, name, salary 
FROM HR.EMPLOYEE 
WHERE NAME = 'Kim' 
UNION ALL 


SELECT e.empno, e.name, e.salary 
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EROM T, PR EMPLOYEE € 
WHERE ECTS IONS uno 


) 
SELECT SUM(salary) FROM T 


188000.00 


1 record(s) selected. 


9.4.3 报表 开发 中 的 GROUP BY 扩展 


GROUP BY 子 句 对 指定 字段 进行 分 组 , 并 对 每 一 个 分 组 计算 聚集 结果 ,例如 SUM、COUNT、 
AVG, MAX 等 。 然 而 ， 在 OLAP 应 用 中 ， 经 常 需要 对 数据 进行 多 维 分 机， 不仅 要 计算 基本 分 
组 的 聚集 结 末 ， 还 需要 计算 不 同 维度 的 小 计 和 总 计 。 

针对 上 面 的 需求 , 用 基本 的 GROUP BY £l UNION ALL 也 可 以 实现 , 但 是 需要 编写 复杂 的 
SQL 语句 ， 而 且 性 能 往往 不 佳 。 

斑 运 的 是 ，DB2 提供 了 GROUP BY 扩展 ， 它 很 容易 束 能 满足 上 和 面 的 需求 。DB2 提供 的 
GROUP BY 扩展 , 包括 GROUP BY ROLLUP、GROUP BY CUBE、GROUP BY GROUPING SETS 
以 及 GROUPING 函数 。 


比较 : GROUP BY 扩展 


DB2 支持 三 种 方式 的 GROUP BY 扩展 : 

e GROUP BY ROLLUP: 对 基本 分 组 计算 聚集 ， 然 后 依次 计算 小 计 ， 再 计算 总 计 。 
e GROUP BY CUBE: 对 每 个 维度 组 合计 算 聚 集 ， 再 计算 总 计 。 

e GROUP BY GROUPING SETS: 对 每 个 维度 计算 聚集 结果 。 


在 正式 讲解 GROUP BY 扩展 之 前 ， 需 要 使 用 示例 数据 ， 如 下 所 未 : 


SELECT workdept, job, sex, sum(salary) sum sal FROM employee 
GROUP BY workdept, job, sex 
ORDER BY workdept, job, sex; 


WORKDEPT JOB 


SEX SUM SAL 
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A00 CLERK E 152750. 00 
A00 CLERK M 88500.00 
A00 SALESREP F 46500.00 
A00 SALESREP M 66500.00 
DIMI CLERK E 84630.00 
DISI CLERK M 177880. 00 
DISI DESIGNER E 239210- 00 
DIMI DESIGNER M 341100.00 
DINI MANAGER F 96170.00 
DINI MANAGER M 172250., 00 
Ind MANAGER F 398640.00 
加 MANAGER M 174425.00 
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w11 OPERATOR F 154300. 00 
211 OPERATOR M 73090.00 
E21 PLEBLDREP E 35370.00 
E21 FIELDREP M 2247150.00 


16 条 记录 已 选择 。 


1. GROUP BY ROLLUP 


GROUP BY ROLLUP (workdept，job) 包含 下 面 这 些 分 组 : 

e  (workdept, job) : 按照 这 两 个 学 段 进行 基本 分 组 并 计算 聚集 。 

e (workdept) : 在 workdept 字段 上 做 小 计 ， 对 应 的 数据 行 job FRNT 

e 计算 总 计 ， 见 最 后 一 行 。 

可 以 看 出 ，GROUP BY ROLLUP 先 对 基本 分 组 进行 聚集 ， 然 后 依次 小 计 ， 最 后 计算 总 计 。 
因此， 如 果 在 ROLLUP 中 指定 n 列 ， 根 据 这 个 分 组 过 程 ， 一 共有 n+l 个 分 组 ， 如 下 所 示 : 

SELECT workdept, job, sum(salary) sum sal FROM employee 


GROUP BY ROLLUP (workdept, job) 
ORDER BY workdept, job; 


WORKDEPT JOB SUM SAL 

AO0 CLERK 241250. 00 
A00 SALESREP 113000.00 
A00 = 354250. 00 

DIRI CLERK 262310. 00 
DIT DESIGNER 574370.00 
DAS MANAGER 168420. 00 
DAR = 1005300. 00 

E11 MANAGER 573065.00 
ELI OPERATOR 22 1390.00 
ELI = 800455.00 

PAI EXEISUIDDDEBIE 28252000 
E21 = 202520. 00 


- - 227022 300 


13 条 记录 已 选择 。 
2. GROUP BY CUBE 


GROUP BY CUBE(workdept, job) 包 含 下 面 这 些 分 组 : 
e  (workdept, job) : 按照 这 两 个 字段 进行 基本 分 组 并 计算 聚集 。 
e  (workdept) : 在 workdept 字段 上 做 小 计 ， 对 应 的 数据 行 job FRNT- 
(job) : 在 job 字段 上 做 小 计 ， 对 应 的 数据 行 workdept 字段 为 空 。 
e 计算 总 计 : 见 最 后 一 行 。 
可 以 看 出 ，GROUP BY CUBE 对 分 组 中 的 列 进 行 组 合 ， 并 计算 所 有 组 合 分 组 的 聚集 结果 。 如 
RIE GROUP BY CUBE 中 指定 n 列 ， 根 据 这 个 分 组 过 程 ， 一 共有 2 n 次 方 个 分 组 ， 如 下 所 示 : 


SELECT workdept, Job, sum(salary) sum sal FROM employee 
GROUP BY CUBE(workdept, job) 
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ORDER BY workdept, 


WORKDEPT JOB 


CEIRI 

SALESREP 
(EIER ES 

DESIGNER 
MANAGER 
MANAGER 
OPERATOR 


ESPERE EBP 
CLERK 
DESIGNER 
ESEBUEIDE SE 
MANAGER 
OPERATOR 
SALESREP 


19 条 记录 已 选择 。 
3. GROUP BY GROUPING SETS 


ajo 


SUM SAL 


241250. (90 
113000., 00 
354250. 00 
262510. 00 
574370. 00 
168420. 00 
1005300. 00 
973065. 00 
22 1390.00 
600455. 00 
282520. 00 
2025320., 00 
303760., 00 
574370. 00 
282520. 00 
741485- 00 
22 1390.00 
113000. 00 
244. 29.2 980.0 


GROUP BY GROUP SETS(workdept, job) 包 含 下 面 这 些 分 组 : 

e (workdept) : 在 workdept 字段 上 做 聚集 ， 对 应 的 数据 行 job FRNT- 

e (job): 在 job 字段 上 做 聚集 ， 对 应 的 数据 行 workdept FRÄIT o 

可 以 看 出 ，GROUPING SETS 只 是 对 每 个 字段 进行 聚集 计算 。 如 果 在 GROUPING SETS 中 
指定 n 列 ， 根 据 这 个 分 组 过 程 ， 一 共有 nm 个 分 组 方式 ， 如 下 所 示 : 


SELECT workdept, JOb, sum(salary) sum sal FROM employee 
GROUP BY GROUPING SETS(workdept, Job) 
ORDER BY workdept, job; 


WORKDEPT JOB SUM SAL 

AO0 - 29492. 5000) 0) 
D11 = 1005300., 00 
E11 = 600455- 00 
E21 = 2025320. (08 
= CLERK 503760. 00 
= DESIGNER 574370. 00 
= FIELDREP 2825320. 00 
= MANAGER 741485- 00 
= OPERATOR 22 1390.00 
= SALESREP 113000. 00 


10 条 记录 已 选择 。 
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4. GROUPING 函数 


从 上 面 可 以 看 到 ，GROUP BY 扩展 生成 的 小 计 字 段 上 的 值 为 NULL， 这 个 NULL 值 是 特殊 
的 ， 但 是 原始 数据 本 喘 也 可 能 存在 NULL 值 。 如 何 区 分 它们 呢 ? 

这 需要 通过 GROUPING 函数 来 实现 。GROUPING 以 一 个 分 组 字段 作为 参数 ， 如 果 输 出 是 
小 计 和 字段 或 者 合计 字段 返回 I, RIS 0。 

如 下 所 示 ， 在 EMPLOYEE 表 中 ， 有 一 条 记录 的 workdept 值 为 E21，job 值 为 NULL， 这 样 
输出 结果 中 倒数 第 3 fT (当前 行 输出 ) 和 倒数 第 2 行 ( 小 计 行 输出 ) 是 一 样 的 。 有 了 GROUPING 
PRAE. 束 可 以 根据 g job ETA 1 来 判断 , 可 以 看 出 倒数 第 2 行 的 g job 为 1, 所 以 为 小 计 行 。 


SELECT workdept, Joo, sun(saleary) sum sal, 
grouping (workdept) g dept, grouping(job) g job 
FROM employee 
GROUP BY ROLLUP (workdept, Job) 
ORDER BY workdept, job; 


WORKDEPT JOB SUM SAL G DEPT © JOB 
A00 CLERK 241250. 00 0 0 
A00 SALESREP 115000. 00 0 0 
A00 - 354250, 00 0 1 
D11 CLERK 262510. 00 0 0 
D11 DESIGNER 57495 70-090 0 0 
DII MANAGER 168420.00 0 0 
Du - 1005300. 00 0 1 
Tod MANAGER 573065.00 0 O 
ELI OPERATOR 22 1390,00 0 0 
Iu = 600455,- 00 0 1 
E21 FIELDREP 282520. 00 0 0 
E21 = 10000.00 0 0 
E21 = 292520.00 0 T 
= = 2452525. 00 1 1 


14 条 记录 已 选择 。 


GROUP BY 扩展 功能 非常 强大 ,理解 它 们 的 分 组 原理 ， 笛 握 它 们 的 功能 ， 束 能 在 实际 报表 
JE AR LTETRORHE SR ETE RI. 


9.5 fm EX SQL 语句 


SQL 语言 非 第 灵活 ， 可 以 使 用 多 种 写法 实现 同一 功能 ， 但是， 这 么 多 写法 里 面 哪 一 种 才 是 
最 高 效 的 ? 或 者 换 句 话说 ， 如 何 编 写 高 效 的 SQL 语句 ， 从 而 充分 利用 DB2 优化 器 的 能 力 ? 本 
节 将 重点 讲解 这 个 问题 。 


9.5.1 不 要 检索 多 余 的 数据 
在 每 条 SQL 语句 的 SELECT 列表 中 只 检索 应 用 需要 的 列 ， 把 不 必要 的 列 放 在 SELECT 列 
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表 中 将 会 消耗 额外 的 内 存 和 CPU 资源 。 例 如 ， 很 多 开发 人 员 喜 欢 使 用 “SELECT * ”语句 ， 
将 检索 所 有 列 ， 并 非 好 的 SQL 编程 习惯 。 

对 于 数据 行 也 是 一 样 , 应 该 尽量 使 用 WHERE 条 件 让 DB2 去 过 滤 数 据 ， 而 不 是 取出 所 有 数 
据 让 应 用 程序 来 处 理 。 同 等 情况 下 ， 从 DB2 传递 到 应 用 程序 的 数据 行 越 少 ，SQL 效率 就 越 局 。 
开发 人 员 容 易 犯 的 错误 是 : 在 应 用 程序 中 处 理 一 些 本 来 可 以 让 DB2 来 过 滤 的 数据 。 


9.5.2 ”避免 在 连接 谓词 中 使 用 复杂 表达 


连接 谓词 应 该 尽量 人 简单， 避免 在 连接 谓词 中 使 用 表达 式 ， 最 好 是 “字段 名 = 字段 名 ”， 上 比 
如 “TI1.C1=T2.C2”， 而 且 最 好 在 设计 数据 模型 时 保持 这 两 个 字段 的 类 型 (包括 类 型 长 度 或 精 
BE) 完全 一 致 ， 这 样 的 连接 谓词 在 执行 时 效率 最 高 。 

人 下面， 用 两 个 例子 来 说 明 。 

(1) 连接 谓词 使 用 表达 式 

例如 : 


WHERE SALES o PRICE ~= SALES- DISCOUNT = ORDERS o FINAL PRICE 


对 于 这 条 SQL 语句 ,可 以 使 用 4.2.1 "SC E SALES 3€ EJ ETC AR E FINAL PRICE, 
并 作为 生成 列 由 PRICE XDISCOUNT 计算 得 到 。 
(2) 连接 谓词 使 用 函数 
例如 : 


WHERE UPPER(CUST.LASTNAME) = ORDERS.NAME 


对 于 这 条 SQL 语句 ， 应 该 避免 列 CUST.LASTNAME 和 列 ORDERS.NAME 上 的 数据 有 大 
小 号 兰 别 ， 这 样 承 没有 必要 使 用 UPPER KJ 
人 注意 : 在 SQL 语句 中 使 用 复杂 表达 式 
在 SQL 语句 中 使 用 A4 杂 表 达 式 的 谓词 有 如 下 缺点 : 
e 影响 优化 器 在 生成 访问 计划 时 对 索引 和 连接 方法 的 选择 。 
e — | 用 统计 信息 估计 的 精确 度 。 
e 带 有 复杂 表达 式 的 谓词 一 般 只 能 作为 效率 低下 的 residual 谓词 。 
e 一 般 地 ， 对 这 样 的 SQL 应 该 做 适当 的 改写 。 


9.5.3 将 复杂 表达 式 放 在 单 


保持 局 部 谓词 足够 简洁 ， 这 是 一 个 重要 原则 。 

如 果 确 实 需 要 使 用 函数 或 者 表达 式 做 转换 ， 应 该 放 在 常量 上 ， 例如: “学 段 名 = 第 数 表达 
式 ”， 这 样 便于 匹配 字段 上 的 索引 ， 也 有 利于 优化 絮 更 准确 地 估算 基数 。 

考虑 下 面 的 谓词， 表达 式 作 用 在 表 的 子 段 上 : 

IgE esc IE DOSE) ons ne 


INTEGER(TRANS DATE)/100 - 200802 
WHERE (CUST ID * 100) + INT(CUST CODE) = 123456 
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应 该 改写 为 如 下 形式 ， 这 样 ， 如 果 字 段 Col、TRANS DATE 或 者 CUST ID 上 有 索引 ， 优 
Hei SL HEX TE ER uH EAR: 
Col = INVERS EXPRESSION ("CONSTANE") 


TRANS DATE BETWEEN 20080201 AND 20080229 
WHEERE CUST ID = 1234 AND CUST CODE = "56" 


9.5.4 使 用 DB2 提供 的 日 期 类 型 


在 数据 库 设 计 中 ,很 多 设计 人 员 喜 欢 使 用 INTEGER 或 者 CHAR/VARCHAR 存储 日 期 数据 ， 
这 不 是 好 的 设计 ， 实 际 上 , 直接 使 用 DB2 的 日 期 类 型 是 更 好 的 选择 。 这 样 一 方面 可 以 利用 DB2 
提供 的 大 量 日 期 函数 ， 男 一 方面 DB2 优化 器 也 可 以 将 这 些 日 期 函数 自动 转换 成 简单 谓词 。 

例如 ， 在 表 tpcds.date dim 的 d date 字段 〈 类 型 为 DATE) 上 建立 索引 ， 这 样 对 WHERE 
条 件 中 使 用 日 期 函数 YEAR 和 MONTH 的 查询 , DB2 优化 器 能 将 这 两 个 日 期 函数 转换 成 简单 谓 
词 ， 而 不 是 效率 低下 的 residual 谓词 ， 从 而 提高 查询 性 能 ， 如 下 所 示 : 


Original Statement: 

Sik Scere E 

Erom pedo date dim 

where year(d date)- 2012 and month(d date) -10 


Optimized Statement: 

和 

TROM TPCDS. DATE DIM AS QI 

WHERE ('2012-10-01' <= Q1.D_DATE) AND (Q1.D_DATE < '2012-11-01') 


Access Plan: 


Total Costs 15.1672 
Query Degree: 1 
ROWS 
RETURN 
(-— 1) 
COST 
IDA 
| 
29:9906 
PETCH 
( 2) 
15.1672 
2 
/----+----- N 
29.9908 73049 
IXSCAN DES VABIM Ip SIDES 
( 5) DATE DIM 
7.57442 Q1 
1 
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713049 
DP-INDEX: TPCDS 
DE DATE 
Q1 
9.5.5 谨慎 对 待 隐 了 却 类 型 转换 


DB2 V9.7 之 前 ，DB2 — ĦA SQL 标准 的 数据 类 型 系统 ， 遵 守 强 类 型 运算 规则 ， 错 误 的 
数据 类 型 运算 将 导致 编译 错误 ， 比 如 字符 串 和 数字 不 能 比较 ， 除 非 经 过 显 式 的 类 型 转换 。 

DB2 V9.7 开始 文 持 隐 式 数据 类 型 转换 《也 叫 自 动 类 型 转换 ) 。 如 下 所 示 ，DB2 将 字符 
型 自动 转换 成 数值 类 型 ， 也 可 以 将 数值 类 型 转换 成 字符 类 型 ， 还 可 以 完成 DATE 类 型 与 字 
型 的 相互 转换 。 


-- C1 为 数值 类 型 ，DB2 自动 将 '12' 这 个 字符 类 型 转换 成 数值 类 型 ， 然 后 进行 比较 


SELECT sum(aty) OM 


E C AR 7 ee da JENA và SERN], EATA ERAJ ERE AAR, m hH DB2 
完成 数据 类 型 自动 转换 。 
隐 式 数据 类 型 转换 虽然 很 方便 ， 却 有 诸多 缺点 : 
e 对 于 错误 的 隐 式 类 型 转换 ， 在 编译 时 不 会 发 现 问题 ， 而 是 到 了 运行 时 才 报 错 ， 这 会 给 
租 找 和 解决 问题 融 来 很 大 的 困难 。 
e 从 性 能 方面 考虑 ， 隐 式 数 据 类 型 转换 虽然 方便 ， 但 也 是 要 消耗 时 间 的 ， 如 果 在 循环 中 
频繁 地 进行 这 种 隐 式 类 型 转换 ， 会 消耗 一 定 的 CPU 资源 。 
e 在 得 询 中 使 用 隐 陈 类 型 转换 可 能 导致 索 引 抑制 ， 从 而 市 来 性 能 上 的 损害 。 在 9.3.5 BID 
案例 中 ,含有 隐 式 转换 的 连接 谓词 Q2.VOUCHER ID = QI.PAY DOC ID, 即 将 CHAR(8) 
的 字段 与 CHAR(20) 字 段 进 行 比较 ， 导 致 了 性 能 问题 。 
因此 , 开发 人 员 在 使 用 隐 式 类 型 转换 时 应 保持 谨慎 态度 ， 只 有 真正 理解 其 对 SQL 语句 的 性 
能 影响 后 ， 才 可 以 考虑 使 用 。 


9.5.6 ”外 连接 的 顺序 


对 于 内 连接 (INNER JOIN) Wa, DB2 能 上 自动 选择 和 调整 表 与 表 连 接 的 顺序 ， 但 是 外 连 
接 会 限制 连接 的 顺序 ， 从 而 导致 一 些 好 的 访问 计划 无 法 生成 。 这 里 讲 到 的 外 连接 包括 3 种 : 左 
外 连接 (LEFT OUTER JOIN ) 、 右 外 连接 (RIGHT OUTER JOIN ) 和 全 连接 (FULL OUTER JOIN). 

下 面 来 看 某 银 行 的 一 个 实际 案例 ， 如 下 所 示 ，4 个 表 之 间 的 连接 操作 ，T1 和 T2 先 做 LEFT 
JOIN, EA T3 做 内 连接 ， 最 后 和 T4 做 内 连接 。 根 据 实际 情况 ，T1 和 T3 之 间 的 内 连接 谓词 具 
有 最 好 的 过 滤 因 子 ， 但 是 由 于 LEFT JOIN 存在 ，T1 不 能 与 T3 先 做 连接 ， 而 是 必须 先 与 T2 做 
连接 ， 才 能 与 T3 做 内 连接 ， 由 于 Tl 是 儿 亿 行 的 大 表 ， 这 样 连接 的 效率 非常 低 。 

SE 

FROM ECRM. PARS REC APPLY INFOQ TI 

LEFT JOIN ECRM.PARS REC APPROVE T2 
ON T1.NUM = 了 2 .NUM 


INNER JOIN ECRM ECR CUST MANAGER T3 
ON T1.PAYER_CUST_MANAGER_ID = T3.CUST_MANAGER_ID 
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INNER JOIN AP USER T4 
ON T1.ELEC MAIL = T4.LOGIN NAME ||'@bank.com' 


WEERE T4 USER CODE = "9606060196" 


这 时 ， 必 须 手 工 调 整 表 连 接 的 顺序 ， 让 TI 先 和 T3 做 内 连接 ， 再 和 TA 做 内 连接 ， 最 后 再 
EH T2 做 左 外 连接 ， 修 改 后 的 语句 如 下 所 示 ， 根 据 测 试 结 果 ， 其 性 能 提升 了 2000 倍 左 右 。 


EXE ogo ooo 
VROM ECRM. PARS REC APPLY INFO T1 
INNER JOIN ECRM.ECR CUST MANAGER T3 
ON T1.PAYER_CUST_MANAGER_ID = T3.CUST_MANAGER_ID 
INNER JOIN AP USER T4 
ON TI- ELEC MAIL = TA LOGIN NAME | |“ do mise o 
LEFT JOIN ECRM.PARS_REC_APPROVE T2 
ON T1.NUM = T2 NUM 
WEERE T4 USER CODE = “96000196 " 


a 注意 : 外 连接 中 表 顺 序 | 
关于 多 表 之 间 内 连接 的 顺序 ， 优 化 器 会 合理 选择 和 调整 内 连接 的 顺序 以 获得 最 好 性 
能 。 但 是 ， 外 连接 是 特殊 的 ， 它 限制 了 连接 的 顺序 ， 在 编写 多 表 连 接 的 SQL 语句 时 ， 
应 特别 注意 外 连接 时 表 的 顺序 。 


9.5.7 IN 和 EXISTS FEH 


在 SQL 语言 中 ， 当 一 个 查询 语句 的 套 在 为 一 个 查询 中 时 ， 称 为 子 伍 询 。DB2 PB Tf 
有 多 种 形式 ， 这 里 主要 讨论 如 下 几 种 : 

e IN Ñ! EXISTS; 

e NOT IN 和 NOT EXISTS; 

e 使 用 反 连 接 CANTIJOIND 优化 子 查询 。 


1. IN 和 EXISTS 


DB2 WAEA IN 和 EXISTS 子 合 询 时 ， 会 将 其 转换 为 连接 ， 从 而 生成 更 优 的 访问 计 
划 。 例 如 ， 下 面 的 IN 和 EXISTS 子 查 询 是 等 价 的 : 


asslecr c el cl MEUM Se? 


Leom T1 

where exists(select 1 from T2 where TITl.cl = T2.c1) 
或 者 

sedeo c IEEE c EU 

from T1 


where cl in (select t2.cl from T2) 


DB2 优化 需 会 将 上 面 两 条 SQL HORRA PERNA, KERA EIE BV Ie) VE X 
时 不可 以 为 下 面 的 连接 考虑 多 种 连接 方法 ， 特 别 在 这 两 个 表 还 与 其 他 表 做 连接 时 ， 这 种 转换 将 
显得 更 有 效 。 


seleekedristinectete > el 0b cl El 2 t 103 
crom TLl, T2 
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will eS ee 


注意 其 中 的 distinct 关键 字 ， 这 是 保持 语义 等 价 所 必需 的 。 显 式 的 DISTINCT 需要 排序 来 
实现 ， 是 一 种 成 本 较 高 的 操作 。 只 有 当 T2.C1 字段 共有 唯一 性 (例如 是 主键 或 者 字段 上 创建 有 
唯一 索引 ) 时 ， 优 化 器 才 不 会 在 转换 后 的 SQL 语句 中 加 DISTINCT。 因 此 ， 出 于 性 能 方面 的 考 


虑 ， 应 避免 使 用 子 合 询 ， 特 别 是 欣 套 层次 较 多 的 子 人 查询。 
人 注意 : 子 查询 (IN 和 EXISTS) 与 连接 


在 编写 SQL 语句 ， 应 尽量 使 用 连接 ， 其 次 才 考 虑 子 查 询 ， 


2. NOT IN 和 NOT EXISTS 


一 般 情 况 下 ，NOT EXISTS 比 NOT IN 的 性 能 要 好 ， 但 是 这 并 不 绝对 。 

来 看 一 个 例子 ， 下 面 的 SQL 语句 使 用 NOT IN 子 查 询 列 出 所 有 还 没有 下 过 订单 的 客户 。 
从 访问 计划 图 中 可 以 看 出 ，NOT IN 的 访问 计划 执行 顺序 为 : 先 扫描 内 表 STORE SALES， 然 
后 再 扫描 外 表 CUSTOMER， 总 成 本 为 7.42152e*06. 


select * from tpcas .customerL 
where C CUSTOMER SK NOT IN 
(select 99 CUSTOMER SK Crom tPECS.STCOre sales) 


Access Plan: 


Total ost: 7.42152e-06 
Query Degree: 1 
Rows 
RETURN 
(i 
COST 
IB A 
| 
250000 
PETCH 
E 
7.42152e-406 
8338:35 
二 一 一 一 一 一 一 一 一 一 一 一 一 二 十 一 一 一 一 一 一 一 一 一 一 一 一 + 
500000 413696 500000 
IXSCAN TBSCAN dS DS 
(o 3) ( 4) CUSTOMER 
1087.56 397920.1 Q3 
5332125 A929 22 
| | 
500000 413696 
ENDENE BM SORT 
S$S0L120728090612660 ( 5) 
Q3 37861,1 
2 ,22 
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eT07 
IXSCAN 
( 6) 
25462 .9 
4929.22 

| 

1e-07 

[DEN DS 

EU 

Q1 


Hj NOT EXISTS 改写 上 面 的 查询 ， 相 应 的 SQL 语句 和 访问 计划 如 下 所 示 。 访 问 计划 的 总 
成 本 为 37094.4, EG NOT IN 访问 计划 的 成 本 要 小 得 多 。 从 访问 计划 图 中 可 以 看 出 , NOT EXISTS 
的 访问 计划 执行 顺序 为 : 先 扫 描 外 表 CUSTOMER， 对 于 外 表 的 每 一 行 ， 再 扫描 内 表 
STORE SALES， 看 是 否 满足 NOT EXISTS 谓词 。 

ccce UE OIN od Us P eH E 

where NOT EXISTS 


(select 1 from Ttpes.stOre sales C CUSTOMER Moog SK) 


Access Plan: 


Total Costs 37094.4 
Query Degree: 1 
ROWS 
RETURN 
(o 49 
COST 
X 7; 
| 
86304 
x^NLJOIN 
( 2) 
37094,4 
6344 
/------ +------- \ 
500000 20 
TBSCAN IXSCAN 
0 ( 4) 
559102 60 .9982 
2880 8 
| | 
500000 le+07 
TABLES TeGDS DES RN DE DIS 
CUSTOMER SS CUST 
QZ pu 


从 上 面 的 访问 计划 中 ， 可 以 发 现 DB2 处 理 这 两 种 子 查询 机 制 上 的 差别 : 
e NOTIN 是 目 内 向 外 的 操作 ， 即 先 得 到 子 俘 询 的 结果 ， 再 执行 外 层 的 便 询 。 
e NOT EXISTS 恰好 相反 ,是 目 外 和 癌 内 的 操作 ， 先 扫 摘 外 表 , 根据 外 表 的 每 一 行 去 扫描 子 


frg m py owe e 
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在 这 个 例子 中 ， 子 查询 的 内 表 STORE SALES 是 1 千 万 行 的 大 表 ， 得 到 的 NOT IN 列表 比 
较 大 ， 为 413696 个 值 ( 去 重 以 后 )， 在 这 种 情况 下 ，NOT IN 的 性 能 要 比 NOT EXISTS 的 性 能 
差 很 多 。 

一 般 地 ， 如 果子 查询 的 结果 集 比 较 小 ， 例 如 内 表 上 有 过 滤 因 子 很 小 的 局 部 谓词 时 ， 可 以 选 
择 使 用 NOT IN 子 但 询 ， 如 下 所 示 : 


SELECT T1.* FROM T1 WHERE T1.C1 NOT IN 
(SELECT 1 FROM T2 VIII BT 22 5 5)2 


相反 的 ， 如 果 外 层 查 询 的 结果 集 比 较 小 ， 例 如 外 表 上 有 过 滤 因 子 很 小 的 局 部 谓词 时 ， 可 以 
选择 使 用 NOT EXISTS 子 查询 ， 如 下 所 示 : 


SELECT T1.* FROM T1 WHERE T1.C2 = 6 WHERE NOT EXISTS 
(SELECT 1 FROM T2 WHERE T2.C1=T1 C1) %7 


Aa 注意 :NOT IN 和 NOT EXISTS 并 不 ; 
NOT IN # NOT EXISTS 的 语义 并 不 完全 等 价 ， 当 外 表 的 连接 列 可 以 为 空 值 时 ， 其 
查询 结果 可 能 不 同 ， 如 下 例 所 示 : 


wica ci (el, c2) as (values (1,1), nud d 
t2 (el -c2) as (Values (2,1)) 
select * from tli where cl not in (select cl from t2) 


1 record(s) selected. 


wich cil cir o7) as (values (1,1), (nurli, 1), 


t2 (el,c2) as (values zen 


select * from tl where not exists (select 1 from t2 where tl.cl- t2.c1l) 


2 record(s) selected. 


3. 反 连 接 

读者 在 阅读 上 和 耐 NOT EXISTS 子 查 询 的 访问 计划 时 ， 会 发现 连接 操作 xX^NLJOIN 与 普通 
NLJOIN 操作 符 不 一 样 ， 有 一 个 特殊 的 前 级 。 进 一 步 查 看 这 个 操作 符 的 详细 信息 ， 会 发 现 
OUTERJN 这 个 参数 被 设置 为 LEFT(ANTD)， 如 下 所 示 : 


2) NLJOIN: (Nested Loop Join) 


Cumulatuve Total Cost: 37094.4 
Cumulatrve CPU Cost: 1.41028e-10 
Cumulative I1I/0 Costes 6344 
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Cumulative Re=-Total Costs 71116.39 
Cumulative Re-CPU Cost: 1 351996410 
Cumulative Re-I/O Cost: 0 
Cumulative First Row Cost: 15,2109 
Estimated Bufferpool Buffers: 6344 
Arguments s 


EARLYOUT: (Early Out flag) 
LEFT 

FETCHMAX: (Override for FETCH MAXPAGES) 
IGNORE 

ISCANMAX: (Override for ISCAN MAXPAGES) 
IGNORE 

OUTERJN : (Outer Join type) 
LEFT (ANTI) 


Predicates: 


2) PreciLleatce usec) in Join, 


Comparison Operator: Equal (=) 
Subquery Input Required: No 
Pilter rFactor: 2e-06 


Predicate Text: 


(Q2.C CUSTOMER SK - Q1.SS CUSTOMER SK) 


那么 ,什么 是 反 连 接 ? 顾名思义 ， 反 连接 是 连接 的 反 辐 操作 ， 它 的 结果 集 是 左 外 连接 的 结果 
集 减 去 内 连接 的 结果 集 。 


A NT 


在 访问 计划 中 ，ANTIJOIN 是 普通 连接 操作 的 特殊 形式 (有 一 个 “x^” 前 级 ) ， 其 实际 操 
作 符 可 以 为 NLJOIN、MSJOIN 或 HSJOIN， 只 是 将 OUTERJN 这 个 参数 设置 为 ANTI 表示 该 连 
接 为 反 连 接 。 

反 连 接 (ANTI-JOIN) 是 DB2 优化 NOT EXISTS 和 NOT IN 子 查 询 的 一 种 比较 高 效 的 方法 ， 
DB2 优化 器 会 尝试 将 NOT EXISTS 和 NOT IN 转换 成 反 连 接 。 

如 果 要 对 某 个 查询 启用 反 连 接 ， 可 以 使 用 如 下 的 优化 概要 来 指导 优化 器 做 这 种 转换 : 


-- 将 NOT IN 转换 成 反 连 接 的 优化 概要 
ON 


-- 将 NOT EXISTS 转换 成 反 连 接 的 优化 概要 
«OPTGUIDELINES»«NOTEX2AJ OPTION-'ENABLE'/»«/OPTGUIDELINES» 


如 果 要 在 整个 实例 范围 内 设置 反 连 接 ， 可 以 使 用 注册 变量 DB2_ANTIJOIN， 它 的 值 可 以 为 
YES. EXTEND 和 NO: 
e 当 DB2 ANTIJOIN=YES: DB2 优化 右 将 尝试 将 NOT EXISTS 子 查 询 转 换 为 蜗 效 的 有 反 连 
接 ， 单 分 区 数据 库 上 ， 默 认为 YES. 
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e 当 DB2 ANTIJOIN=EXTEND: DB2 优化 带 将 尝试 将 NOT EXISTS 和 NOT IN FAHR 


转换 为 反 连 接 。 
e 当 DB2 ANTIJOIN=NO: DB2 优化 器 将 限制 某 些 将 NOT EXISTS 子 查 询 转换 为 反 连 接 
的 机 会 。 


然而 ， 将 NOT EXISTS 和 NOT IN 转换 成 反 连 接 并 不 能 100% 保 证 能 提高 性 能 (尽管 大 多 
数 情况 能 提高 性 能 ) ， 因 此 应 该 做 好 全 面 的 性 能 测试 和 验证 。 


9.5.8 OFNR 和 FFNR F4 


OFNR (OPTIMIZE FOR N ROWS) 子 句 告诉 优化 右 ， 返 回 整个 结 末 集 ， 但 硕 望 以 最 快 的 
速度 返回 前 N 行 。 这 时 ，DB2 会 选择 返回 前 N 行 结果 最 快 的 访问 计划 ， 但 并 不 一 定 是 获取 整 
个 结果 集 最 佳 的 访问 计划 。 

FFNR (FETCH FIRST N ROWS ONLY) 子 句 告诉 优化 器 ， 不 用 返回 整个 结 末 集 ， 只 返回 
前 NN 行 束 可 以 了 ,这 时 DB2 会 选择 获得 整个 结果 集 最 佳 的 访问 计划 ， 但 只 返回 前 N 行 给 应 用 。 

SQL 开发 人 员 应 根据 需要 灵活 选择 OFNR 或 者 FFNR. 


9.5.9 动态 SQL vs 静态 SQL 


在 DB2 中 ， 存 在 两 种 类 型 的 SQL 语句 : 动态 SQL 和 静态 SQL。 动 态 SQL 的 执行 计划 需 
要 每 次 执行 时 编译 ;静态 SQL 语句 的 访问 计划 在 绑 定 BIND) 时 就 已 经 确定 ， 执 行 时 只 需要 
把 访问 计划 调 出 来 直接 执行 即 可 。 

DB2 有 一 个 动态 语句 高 速 缓存 ， 它 将 最 近 执 行 的 动态 SQL 语句 和 相应 的 访问 计划 缓存 起 
来 ， 如 果 下 次 过 到 到 同样 的 SQL， 直接 从 缓存 中 谈 取 相应 的 访问 计划 ， 从 而 避免 重复 编 详 。 

C1) 对 OLTP 应 用 ， 尽 可 能 减少 编译 时 间 。 

在 OLTP 应 用 中 , 一 条 SQL 的 执行 时 间 一 般 很 短 ， 利 用 动态 语句 高 速 缓存 节省 的 编译 时 间 
和 CPU 开销 相对 来 说 是 可 观 的 ， 能 带 来 性 能 的 显著 提升 。 

DB2 采用 HASH 算 法 判断 一 个 动态 SQL 语句 的 执行 计划 是 否 在 包 绥 存 中 。 该 算法 根据 SQL 
语句 的 文本 计算 HASH 值 , 即使 两 个 语句 只 有 一 个 字母 大 小 写 的 不 同 , 也 会 造成 HASH 值 不 同 ， 
从 而 认为 是 两 个 不 同 的 SQL 语句 。 

例如 ， 下 和 面 这 两 个 语句 会 被 看 作 是 不 同 的 动态 SQL: 


SELECT EMP ID, EMP NAME, AGE FROM MANAGER INFO WHERE EMP ID - 918233 
SELECT EMP ID, EMP NAME, AGE FROM MANAGER INFO WHERE EMP ID - 920122 


"T UA EENH REFERT n gU EXSTR tg. PETS REUS BUB Uu JPAETAAT ETE BUT 
定 为 实际 的 值 。 这 样 ，DB2 接收 到 的 SQL 语句 是 一 样 的 ， 能 够 命中 动态 语句 局 速 绥 存 ， 从 而 减 
少 编译 开销 。 


SELECT EMP ID, EMP NAME, AGE FROM MANAGER INFO WHERE EMP ID = 2? 


DB2 V9.7 推出 了 语句 集中 器 功能 ， 能 自动 分 析 动态 SQL 语句 ， 对 于 只 是 常量 不 同 的 动态 
SQL 语句 ， 能 让 它们 自动 地 共享 含有 参数 标记 的 SQL 语句 ， 从 而 避免 修改 应 用 程序 。 于 是 ， 这 
些 相似 的 SQL 语句 都 能 命中 高 速 缓存 ， 共 享 访问 计划 ， 节 省 了 编译 时 间 和 CPU 开销 
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缺 省 情况 下 ， 语 句 集 中 器 处 于 禁用 状态 。 如 果 和 希望 对 所 有 动态 语句 启用 语句 集中 器 ， 只 需 
将 STMT CONC 这 个 数据 库 配 置 参数 设置 为 LITERALS， 如 下 所 示 : 


updarte co ctg using STMT CONC LITERALS 


(2) 对 于 OLAP 应 用 ， 尽 可 能 奶 求 最 佳 的 访问 计划 。 
在 OLAP 应 用 中 , 一 条 复杂 得 询 语句 总 的 执行 时 间 往 往 较 长 ,编译 时 间 儿 乎 可 以 忽略 不 计 ， 
所 以 对 这 类 应 用 来 说 ， 根 本 目标 是 获得 最 好 的 访问 计划 。 这 个 时 候 ， 对 复杂 但 询 使 用 类 似 上 面 
的 参数 标记 ， 得 到 的 访问 计划 可 能 不 是 最 优 的 ， 这 是 因为 优化 器 对 谓词 中 参数 和 种 量 的 基数 佑 
计 方 法 是 不 一 样 。 下 面 ， 举 例 说 明 。 
e where sales.nation =? : 不 论 实 际 执行 这 个 SQL 语句 时 传 入 的 参数 是 什么 ,优化 器 将 按 
照 下 和 面 的 公式 来 计算 这 个 谓词 的 过 小 因子 ， 这 可 能 产生 不 精确 的 估计 : 


Pilcer Factor = 1/ card (nation) 


e where sales.nation = 'CHINA': 优化 右 在 计算 这 个 谓词 的 过 滤 因 子 时 ， 能 充分 利用 这 个 

字段 上 的 统计 信息 ， 从 而 进行 更 精确 的 估计 ， 从 而 产生 更 好 的 访问 计划 。 

ij. 在 OLAP 应 用 中 ， 例 如 报表 或 者 分 析 应 用 ， 在 SQL 语句 中 应 尽量 直接 使 用 常量 而 
不 是 参数 标记 ， 这 样 才 会 产生 更 好 的 访问 计划 ， 碍 询 性 能 才 会 高 。 

e 对 于 存储 过 程 和 嵌入 式 SQL 应 用 ， 灵 活 运 用 REOPT 功能 。 

对 于 存储 过 程 和 风 入 式 SQL 应 用 而 言 ， 大 量 的 SQL 语句 都 是 使 用 参数 或 者 宿主 变量 ， 而 
jut SQL 的 访问 计划 在 绑 定 时 就 生成 。 如 何 让 这 些 SQL 使 用 最 新 的 统计 信息 呢 ? 如 何 根 据 参 
数 的 实际 值 生成 最 优 的 访问 计划 呢 ? 

这 可 以 通过 REOPT 提供 的 功能 来 实现 ， 其 体 来 说 ，REOPT AAR LERN: 

e REOPT ALWAYS: 对 于 SQL 语句 的 每 次 执行 ， 都 使 用 变量 的 实际 输入 值 重新 编译 。 

例如 ， 对 于 DB2INSTI.MYPROC 存储 过 程 ， 可 以 使 用 下 面 的 语句 重新 绑 定 程序 包 ， 并 
启用 REOPT ALWAYS 工作 模式 ， 如 下 所 示 : 


CALL SYSBPROC ,REBIND ROUTINE PACKAGE ("P"; ‘DB2INSTI1 .MYBROC", "REOBPT ALWAYS") 


e REOPT ONCE: 与 REOPT ALWAYS 会 造成 过 多 的 语句 编译 开销 不 同 ，REOPT ONCE 
仅 在 第 一 次 执行 时 ， 使 用 变量 的 实际 输入 值 进行 编译 和 优化 ， 后 续 的 执行 会 重用 执行 
计划 ， 不 再 重新 编 诺 。 当 然 ， 第 一 次 执行 时 输入 的 值 应 具有 代表 性 ，REOPT ONCE 才 
能 达到 优化 目的 。 例 如 ， 对 于 DB2INSTI.MYPROC 存储 过 程 ， 可 以 使 用 下 面 的 语句 重 
新 绑 定 程序 包 ， 并 启用 REOPT ONCE 工作 模式 ， 如 下 所 示 : 


CALL SYSBROC .REBIND ROUTINE PACKAGE ("P"; “DBZINSTI .MYBROC", "REOBPT ONCE") 


人 - — —. 
A 注意 : 不 同 的 场景 采用 不 同 
参数 标记 、 常 量 、 语 名 集中 器 和 REOPT， 它 们 的 应 用 场景 不 同 ， 在 实际 应 用 中 ， 应 
根据 场景 合理 运用 .， 
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9.5.10 ”分 组 拼接 字 丛 串 : LISTAGG 


很 多 用 户 曾 为 拼接 不 同行 中 的 字符 串 烦 恼 ， 用 递归 或 者 存储 过 程 可 以 实现 这 个 功能 ， 但 是 
比较 麻烦 。 从 DB2 V9.7.4 开始 ， 新 增 的 LISTAGG 聚集 函数 可 以 非常 简单 地 实现 这 个 功能 。 
下 面 使 用 LISTAGG 的 例子 , 按照 GRP 字段 分 组 ,随后 拼接 NAME 字段 中 不 同行 的 字符 串 : 


create table tí(grp int, name varchar (5)); 


DB20000I The SQL command completed successfully. 


inserte into t values (1, "Jim’), (ll, "Tom);, (1; "Jane", (2; orm n Mae 
DB20000I The SQL command completed successfully. 


select grp,name from t; 


5 record(s) selected. 


--Hi LISTAGG 按 GROUP BY 分 组 拼接 字符 ， 组 内 按 名 字 排 序 。 
SELECT grp, LISTAGG(name, ',') WITHIN GROUP (ORDER BY name) as names 
FROM t GROUP BY grp; 


1 Jane,Jim,Tom 


2 Mike,Tony 


2 record(s) selected. 


在 使 用 LISTGAGG 函数 的 时 候 , 可 以 使 用 WITH GROUP ORDER BY 子 句 对 分 组 内 
的 字段 进行 排序 。 如 本 例 中 ， 在 每 个 分 组 内 ， 按 NAME 排序 后 将 字符 串 拼 接 在 一 起 、 


9.5.11 事务 结束 后 及 时 COMMIT 


在 事务 编程 中 ，COMMIT 语句 用 于 提交 事务 ， 及 时 执行 COMMIT 会 市 来 3 点 好 处 : 

(1) COMMIT 后 ， 对 数据 库 所 做 的 更 改 才 会 真正 落实 到 数据 库 ， 从 而 避免 系统 故障 导致 
的 数据 丢失 。 

(2) COMMIT 之 后 ，DB2 会 释放 当前 事务 在 修改 的 数据 (包括 INSERT, UPDATE 和 
DELETE) 上 持 有 的 锁 ， 这 些 锁 可 能 阻塞 了 其 他 应 用 程序 ， 所 以 及 时 COMMIT 能 提高 数据 库 的 
并 发 性 能 。 另 外 ， 锁 也 是 公共 资源 ， 及 时 COMMIT 释放 的 锁 资 源 能 供 其 他 事务 使 用 。 
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(3) COMMIT 之 后 ， 当 前 事务 〈 特 别 是 长 事务 ) 占用 的 日 六 资源 将 被 释放 ， 可 以 供 其 他 
事务 使 用 。 

最 后 ， 关 于 存储 过 程 相关 的 高 效 编 程 原则 ， 请 参考 《从 Oracle 到 DB2 开发 一 从 容 转 吴 》 
相关 内 容 。 


9.6 小结 


SQL 语句 优化 涉及 很 多 方面 ， 最 重要 的 是 理解 优化 器 原理 ， 并 学 会 分 机 SQL 语句 的 访问 
计划 。 本 章 首 先 介绍 了 优化 器 的 基本 原理 , 深入 讲解 了 访问 计划 各 方面 的 内 容 。 然 后 分 享 了 SQL 
调 优 的 实战 案例 集 ， 这 些 实际 守 例 融合 了 优化 器 、 数 据 库 配 置 、 访 问 计 划 等 各 种 知识 。 最 后 ， 
讲解 了 高 级 SQL 应 用 和 编写 局 效 SQL 语句 的 最 佳 实践 。 

掌握 SQL 优化 技能 ,不 可 一 践 而 残 ， 要 先 理解 基本 概念 和 原理 ,然后 通过 不 断 实 践 ， 最 后 


才能 融会 员 通 。 
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Ea 
DB2 数据 仓库 
设计 与 优化 


本 着 尊重 大 师 、 尊 重 原 创 的 精神 ， 原 文 引 用 数据 仓库 大 师 William H. Inmon 在 《构建 数 
HO) (Building the Data Warehouse ) 一 书 中 对 数据 仓库 的 定义 : 


Data Warehouse is a subject-oriented, integrated, time-variant, and nonvolatile 


collection of data in support of management's decision making process. 

上 面 的 话 的 中 文 意思 就 是 : 数据 仓库 就 是 面向 主题 的 ( subject-oriented ) 、 集 成 的 
( integrated ) . 5: 875 SP 4e 4f, (time-variant ) 的 、 相 对 稳定 ( nonvolatile ) KAHERE, € 
可 用 以 支持 经 v 营 绾 理 中 的 决策 制定 过 程 。 

本 章 将 重点 讲述 DB2 数据 仓库 的 设计 、 搭 建 和 优化 方法 。 
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10.4 数据 仓库 是 什么 


什么 是 数据 仓库 呢 ? 下 面 是 笔 考 对 数据 仓库 大 师 William H. Inmon 前 述 的 数据 仓库 定义 的 
理解 : 
e 面 问 主题 : 是 指数 据 仓 库 中 的 数据 是 按照 一 定 的 主题 域 进行 组 织 的 。 
e 集成 : 是 指数 据 仓 库 中 的 数据 是 在 对 原 有 分 敌 的 数据 库 数据 抽 取 、 清 理 的 基础 上 经 过 
系统 加 工 、 汇 总 和 整理 得 到 的 ， 是 关于 整个 企业 的 一 致 的 全 局 信息 。 
e 反映 历史 变化 : 是 指数 据 仓库 中 的 数据 系统 记录 了 企业 从 过 去 某 一 时 刻 《〈 如 开始 应 用 
数据 仓库 的 时 刻 ) 到 目前 的 各 个 阶段 的 信息 。 
e 相对 稳定 : 是 指 一 旦 数据 进入 数据 仓库 以 后 ， 一 般 情 况 下 将 被 长 期 保留 ， 也 就 是 数据 仓 
库 中 一 般 有 大 量 的 租 询 操作 ， 但 修改 和 删除 操作 很 少 ， 通 音 只 需要 定期 地 加 载 、 刷 新 。 
那么 数据 仓库 出 现 的 现实 依据 是 什么 ? 这 需要 从 传统 的 数据 库 技 术 和 数据 处 理 模式 谈 起 。 
传统 的 数据 库 技 术 往 往 是 以 单一 的 数据 源 《〈 以 数据 库 为 中 心 ) 进行 事务 处 理 、 批 处 理 、 决 
策 分 析 等 各 种 数据 处 理工 作 。 
数据 处 理 模式 主要 划分 为 两 大 类 : 操作 型 处 理 和 分 析 型 处 理 。 操作 型 处 理 也 叫 事务 型 处 理 ， 
是 指 对 数据 库 的 日 常 操 作 ， 它 通常 是 对 一 条 或 一 组 记录 的 查询 或 修改 ， 满 足 了 啊 应 时 间 、 数 据 
的 安全 性 和 完整 性 的 需要 。 分 析 型 处 理 则 用 于 管理 人 员 的 决策 分 析 ， 人 往往 是 大 规模 的 、 批 量 的 
计算 作业 ， 经 单 要 访问 大 量 的 历史 数据 。 
由 此 可 以 看 到 ， 传 统 数据 库 系 统 能 够 完成 企业 的 日 钊 事务 处 理工 作 ， 但 很 难 实现 数据 分 析 处 
理 的 要 求 ， 也 无 法 满足 数据 处 理 多 样 化 的 需求 。 随 看 用 户 需 求 的 发 展 ， 操 作 型 处 理 和 分 析 型 处 理 
的 分 离 束 成 为 一 种 必然 选择 。 于 是 ， 专 门 用 于 分 析 型 处 理 的 系统 ， 即 数据 仓库 ， 便 应 运 而 生 。 


10.1.1 数据 仓库 的 误区 
误区 1: 数据 仓库 是 一 个 产品 ， 买 到 就 能 使 用 。 


目前 ， 一 流 的 软件 厂商 都 会 提供 完整 的 数据 仓库 解决 方案 ， 以 数据 流 的 角度 来 看 ， 从 对 源 
数据 ETL 的 产品 ， 到 支撑 数据 仓库 存储 的 数据 存储 产品 ， 再 到 业务 模型 产品 ， 最 后 到 用 户 直 接 
看 到 的 展现 层面 的 产品 。 完 善 的 数据 仓库 解决 方案 可 以 帮助 用 户 在 构建 数据 仓库 的 各 个 阶段 ， 
轻松 便捷 地 完成 相应 的 工作 。 

数据 仓库 是 以 关系 数据 库 并 行 处 理 与 分 布 式 处 理 、 以 及 联机 分 析 处 理 等 技术 的 发 展 为 基 
础 ， 为 解决 当前 企业 和 组 织 中 虽然 拥有 大 量 数据 、 但 信息 贫乏 的 现状 而 提出 的 ， 是 一 种 对 不 同 
系统 数据 实现 集成 和 共享 的 综合 性 解决 方案 。 所 以 ， 数 据 仓库 不 能 简单 地 理解 成 一 个 产品 ， 它 
是 一 套 架 构 、 一 套 解 决 方案 。 数 据 仓库 必须 经 历 构 建 的 过 程 ， 根 据 用 户 实际 业务 需求 、 现 有 业 
务 系统 信息 情况 进行 构建 的 过 程 。 

误区 2: 数据 仓库 是 一 个 项 目 ， 有 开始 和 也 有 结束 。 


有 一 个 朋友 对 我 说 ，“ 我 正在 为 条 单位 做 一 个 数据 仓库 项 目 ， 预 计 2 个 月 后 结束 。” 从 他 


415 


DB2 设计 、 管 理 与 性 能 优化 艺术 


的 角度 来 襄 ， 这 种 说 法 貌似 也 没 错 。 但 实际 上 上， 对 于 数据 仓库 来 说 ， 它 是 一 个 过 程 ， 数 据 清洗 、 
整合 、 计 算 和 提供 展现 的 过 程 ， 它 是 持续 的 ， 更 像 是 一 段 没 有 终点 的 旅程 。 

在 这 样 的 旅程 中 ， 对 DBA 的 要 求 和 贡 任 也 是 很 高 的 。 面 对 海量 数据 CTB 级 ，PB 级 ) 的 
数据 仓库 ， 怎 样 保证 日 第 数据 加 载 的 效率 ， 又 不 影响 服务 ?怎样 提供 高 可 用 性 的 仓库 ?怎样 实 
现 容 灾 ? 这 一 系列 问题 是 DBA 必须 面 对 和 人 解决 的 。 

误区 3: 数据 仓库 和 效 据 库 产 品 没 区 别 ， 可 以 直接 使 用 一 般 数 据 库 做 为 效 据 仓库 。 


有 朋友 曾经 问 我 ， “数据 仓库 不 融 数 据 存 的 多 些 ， 我 在 数据 库 中 多 定义 一 些 表 ， 多 仓 点 数 
PANATS? ! 在 普通 的 操作 型 数据 库 〈OLIP) PREE SKI, XIE? ” 

这 是 由 于 不 清楚 操作 型 数据 库 COLTPO 和 数据 仓库 《〈OLAP) 系统 各 目的 特点 ， 才 会 有 这 
种 想法 。 

实际 上 ， 数 据 仓库 和 操作 型 数据 库 既 有 区 别 ， 也 有 联系 。 数 据 仓 库 的 建立 并 不 是 要 取代 操 
作 型 数据 库 ， 相 反 ， 它 依赖 于 操作 型 数据 库 ， 并 以 此 为 基础 ， 建 立 一 个 综合 的 和 完善 的 信息 分 
析 系 统 ， 用 于 文 持 各 级 管理 层 决 策 分 析 。 

数据 仓库 弥补 了 原 有 数据 库 的 不 足 ， 将 原来 的 以 单一 数据 库 为 中 心 的 数据 环境 发 展 为 一 种 
狐 的 体系 环境 。 它 具有 一 种 新 的 数据 处 理 结构 体系 ， 能 够 将 不 同 环境 、 不 同系 统 的 数据 统一 起 
来 ， 形 成 综合 的 中 央 数 据 仓库 。 

数据 仓库 和 普通 的 操作 型 数据 库 不 同 ， 它 是 面 癌 主题 (以 主题 为 导 癌 ) 的 ， 文 持 丙 务 决 策 
而 不 是 事务 处 理 。 它 拥有 许多 优化 设计 的 层次 和 结构 化 的 查询 功能 , 并 以 汇总 /综合 系统 为 构架 。 
基于 对 数据 快速 和 有 效 的 分 机 ， 数 据 仓 库 可 为 决策 系统 提供 强 有 力 的 文 持 。 在 开发 人 员 和 用 户 
的 协同 配合 和 精心 设计 下 ， 它 能 够 实现 对 数据 的 一 系列 转化 ， 包 括 从 数据 到 信息 ， 从 信息 到 知 
识 ， 最 终 到 商业 智能 。 

从 DBA 的 视角 出 发 , 对 操作 型 数据 库 和 数据 仓库 系统 的 主要 区 别 做 个 对 比 , 如 表 10-1 所 示 : 


表 10-1 数据 仓库 系统 与 操作 型 数据 库 特 点 比较 
比较 内 容 操作 型 数据 库 
目标 OLTP 联机 事务 处 理 
作用 面向 过 程 
活动 特征 事务 处 
m 异 构 的 、 分 散 的 
内 容 更 改 频率 "TT 
x 性 、 


" 
大 机 .分 
页 
时 间 性 时 序 性 、 历 史 性 当前 的 
基础 结构 ARM 


关系 结构 星 型 /雪人 论 型 结构 或 混 末 型 结构 3NF 三 级 范式 
Aim Hl" 多 为 管理 人 员 和 决策 人 员 多 为 操作 人 员 


其 中 ， 雪 化 型 结构 是 在 星 型 结构 上 的 进一步 扩展 。 泥 洒 型 结构 CHybridO 兼顾 是 型 结构 和 
关系 型 的 特 扣 ， 上 其 有余 些 杂交 优势 ， 它 往往 是 根据 实际 应 用 情况 实施 结构 优化 设计 的 结果 。 
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10.1.2 ”数据 仓库 的 体系 结构 


作为 DBA， 如 采 不 了 解数 据 仓 库 的 体系 结构 ， 不 了 解数 据 仓库 的 特点 ， 了 就 无 法 胜任 数据 仓 
库 的 运 维 工作 。 

如 图 10-1 所 示 ， 数 据 仓库 的 数据 源 来 日 操作 型 数据 库 ， 即 业务 数据 系统 。 在 抽取 、 消 理 、 
装载 CETL) 处 理 系统 的 控制 下 ， 数 据 要 经 历 “ 艰 难 ” 的 历程 ， 按 照 星 型 、 雪 花 型 、 混 杂 型 等 
模型 存储 在 数据 仓库 系统 中 , 形成 一 个 新 的 集成 系统 用 于 联机 分 机 COLAPO 。 最终 , 通过 OLAP 
服务 器 ， 回 用 户 提供 数据 分 机、 数据 报表 以 及 数据 挖掘 等 服务 。 

其 中 ，ETL 过 程 、 数 据 仓 库 的 检测 和 维护 是 数据 仓库 系统 的 重 中 之 重 ， 同 样 也 是 DBA 的 
工作 重点 和 难点 。 


图 10-1 数据 仓库 的 体系 架构 


那么 如 何 提高 数据 加 载 的 效率 ? 如 何 保证 数据 仓库 的 性 能 及 高 可 用 性 ? 面 对 TB 级 、 其 至 
PB 级 数据 ， 数 据 仓库 怎么 进行 灾 备 ? 

上 述 这 些 问 题 不 仅 闻 兰 数 据 仓库 的 设计 ， 也 包 侣 运 维 的 内 容 ， 作 为 DBA， 必 须 面 对 、 思 券 
这 些 问 题 。 下 面 来 看 看 DB2 提供 了 哪些 特性 来 文 持 大 容量 数据 仓库 。 


10.2 ”支撑 数据 仓库 的 DB2 特性 


数据 仓库 系统 具有 数据 量 大 、 奋 询 复杂 、 对 啊 应 时 间 要 求 高 等 特点 ， 为 了 满足 这 一 要 求 ， 
DB2 提供 了 针对 数据 仓库 的 特性 。 这 里 独 重 介绍 DB2 提供 的 分 区 特性 、 针 对 分 区 的 连接 (JOIN ) 
策略 以 及 物化 查询 表 等 特性 。 


10.2.1 分 区 数据 库 


分 区 数据 库 (Partitioned Database) 技术 是 指 将 数据 分 散 到 不 同 的 数据 库 分 区 中 的 技术 。 这 
里 所 说 的 数据 库 分 区 是 数据 库 的 一 部 分 ， 它 包含 数据 库 中 的 部 分 数据 ， 并 具有 独立 的 索引 、 配 
置 文件 和 事务 日 志 。 分 区 数据 库 在 单 分 区 环境 和 多 分 区 环境 下 特点 不 同 , 接 下 来 进行 具体 介绍 。 
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1. 单 分 区 环境 


在 这 种 环境 下 ， 数 据 库 只 有 一 个 分 区 ， 它 文 持 单个 CPU TERAK 
和 多 个 CPU 的 硬件 环境 ， 这 里 只 谈 谈 多 CPU 硬件 环境 ， 即 
SMP (Symmetric Multiprocessor System) 系统 。 

典型 的 SMP 环境 是 在 一 台 具 有 多 CPU 的 服务 器 上 创建 
的 唯一 数据 库 分 区 ， 如 图 10-2 所 示 。 

在 SMP 环 境 下 可 以 实现 分 区 内 并 行 。 由 于 具有 多 个 CPU， 
所 以 不 同 的 数据 库 操作 都 可 以 快速 完成 对 于 查询 任务 , DB2 
数据 库 系 统 将 查询 分 配给 不 同 的 CPU， 来 提高 处 理 速度 。 对 
于 其 他 的 数据 库 操作 ， 比 如 数据 加 载 、 备 份 与 恢复 表 空 间 ， 
以 及 创建 索引 ， 都 会 因 多 CPU 取得 很 好 的 处 理 速 度 。 因 为 数 
据 加 载 命令 、 备 份 与 恢复 命令 都 有 相应 的 参数 指定 并 行 度 ， 图 10-2 SMP 架构 示意 图 
能 充分 利用 多 CPU 从 而 提高 处 理 速度 , 具体 内 容 请 参考 本 书 “ 数 据 库 备份 与 恢复 ”章节 的 内 容 ; 
DB2 在 SMP 环境 下 文 持 并 行 索引 维护 ， 可 以 充分 利用 多 CPU 加 快 索引 的 创建 。 

在 扩展 性 方面 ， 由 于 已 有 了 多 个 CPU，1/O 方面 可 能 存在 瓶 贷 ， 不 过 可 以 通过 增加 人 磁盘 驱 
动 器 的 个 数 ， 来 提升 与 CPU 对 应 的 数据 库 分 区 的 VO 性 能 ， 也 可 以 使 用 专门 的 VO 服务 器 来 专 
门 处 理 IO 请 求 。 

最 后 ， 如 果 目 前 的 SMP 系统 已 经 达到 了 性 能 或 扩展 的 极限 ， 可 以 考虑 将 系统 迁移 到 多 分 
区 数据 库 上 。 

2. 多 分 区 环境 


一 个 数据 库 由 多 个 数据 库 分 区 组 成 ， 数 据 库 分 区 位 于 不 同 的 服务 右上。 多 个 服务 器 和 多 个 
数据 库 分 区 组 合 在 一 起 ， 形 成 一 个 完整 的 数据 库 。 多 分 区 数据 库 文 持 两 种 便 件 环境 。 

(1) MPP (Massively Parallel Processing) 

每 个 数据 库 分 区 都 有 自己 独立 的 服务 器 环境 ， 即 独立 的 CPU、 内 存 以 及 磁盘。 服务 絮 之 则 
通过 高 速 网 络 连接 ， 这 种 环境 也 被 叫做 MPP 环境 ， 或 者 Shared-Nothing 架构 ， 如 图 10-3 所 示 。 
Shared-Nothing 这 个 名 字 准 确 地 摘 述 了 在 这 个 环境 中 资源 的 管理 方式 ， 与 SMP 环境 不 同 ，MPP 
环境 是 由 相对 独立 的 、 不 共 圣 的 数据 库 分 区 组 成 。 


图 10-3 MPP 架构 示意 图 
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在 这 种 环境 中 ， 尺 管 一 个 数据 库 被 物理 上 分 制 成 多 个 数据 库 分 区 ， 但 从 逻辑 上 看 它 依然 是 
一 个 整体 。 当 处 理 查 询 时 ， 协 调节 点 (Coordinator Node) 将 工作 负载 分 配 到 各 个 分 区 上 ， 这 些 
分 区 基于 目 己 管理 的 数据 进行 并 行 处 理 ， 随 后 按照 工作 要 求 ， 将 执行 结 末 返回 给 协调 和 点 ， 协 
调 贡 点 合并 所 有 结果 ， 再 返回 给 应 用 。 

(2) SMP Cluster 

对 于 前 面 讲 的 MPP 环境 ， 还 有 男 外 的 配置 方法 ， 可 以 对 每 个 数据 库 分 区 配置 多 个 CPU 来 
提升 处 理 能 力 ， 这 种 配置 被 称 作 SMP Cluster。 如 图 10-4 Pros. 

那么 这 种 配置 方法 有 什么 优点 呢 ? 这 种 配置 结合 了 SMP 和 MPP 的 优点 , 意味 看 一 个 但 询 语 
名 可 以 在 多 个 分 区 中 并 行 处 理 ， 也 意味 痢 一 个 得 询 语句 可 以 被 一 个 分 区 中 的 多 CPU 同时 执行 。 


图 10-4 SMP 集群 架构 示意 图 


10.2.2 ”灵活 的 数据 分 区 
这 一 市 将 介绍 多 分 区 数据 库 技术 在 DB2 中 的 其 体 实现 ， 即 DB2 的 数据 库 分 区 特性 (Data 
Partitioning Feature) ， 也 简称 为 DPF. 5j7h, DB2 还 提供 了 表 分 区 (Table Partitioning) 和 多 
"EXE (Multidimensional Clustering) 特性 ， 本 节 也 一 并 介绍 。 由 于 DPF、 表 分 区 和 MDC 已 在 
第 S 半 做 了 详细 介绍 ， 本 节 只 就 这 些 技术 在 数据 仓库 中 的 使 用 要 点 进行 讲解 。 
1. DPF 数据 库 分 区 


DPF 采用 的 是 Share-Nothing 体系 结构 ， 依 托 于 构建 在 MPP 或 SMP Cluster 环境 上 的 多 分 
区 数据 库 ， 实 现 了 对 数据 操作 的 并 行 〈 分 区 间 的 并 行 ) ， 从 而 提升 了 数据 库 系 统 的 UO 能 力 和 
MARE, RAUR 10-5 所 示 。 

在 DPF 中 创建 数据 表 时 ， 需 要 在 建 表 语句 “CREATE TABLE) 的 DISTRIBUTE BY 子 句 
中 指定 分 区 键 。 以 下 面 的 建 表 语 句 为 例 ，DB2 数据 库 管理 器 会 根据 表 中 userid 列 进行 哈 希 计 
算 ， 从 而 将 该 表 的 数据 分 布 在 不 同 的 数据 库 分 区 中 ， 这 里 的 user. id 被 称 作 分 区 键 。 


CREATE TABLE user info( user id INT, user name CHAR(8)) DISTRIBUTE BY (user_id) 
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Database 


图 10-5 DPF 架构 示意 


这 个 问题 的 答案 涉及 到 以 下 几 个 知识 点 ， 下 面 分 别 介 绍 一 下 。 
第 一 个 知识 点 : 数据 库 分 区 组 。 
分 区 组 包含 部 分 或 全 部 数据 库 分 区 的 组 合 。 在 DB2 v, 创建 数据 库 分 区 组 的 命令 如 下 : 


CREATE DATABASE PARTITION GROUP 数据 库 分 区 组 名 
ON DBPARTITIONNUM (数据 库 分 区 号 1, 数据 库 分 区 号 2， ... 数据 库 分 区 号 n) 


` 
2" 
-—7 


CREATE DATABASE PARTITION GROUP IRA 
ON DBPARTITIONNUM LT 数据库 办 区 号 厅 TO 数据库 他 区 号 本 条 

第 二 个 知识 点 : 数据 库 表 空间 。 

在 多 分 区 数据 库 环境 中 ， 创 建 表 空 间 需 要 指定 它 所 在 的 数据 库 分 区 组 ， 如 果 不 指定 
分 区 组 的 名 字 ， 数 据 库 系统 将 使 用 默认 的 数据 库 分 组 IBMDEFAULTGROUP。 创 建 表 空 
间 的 命令 如 下 : 

CREATE TABLESPACE RTIA IN DATABASE PARTITION GROUP ARETHA 

在 DB2 数据 库 中 ， 表 被 创建 在 表 空 间 中 。 因 此 ， 表 空间 对 应 的 数据 库 分 区 组 ， 决 定 
了 创建 在 该 表 空 间 上 的 数据 表 对 应 哪些 数据 库 分 区 。 也 就 是 说 ， 表 中 的 数据 可 能 会 分 布 
到 的 数据 库 分 区 ， 是 在 创建 表 空 间 时 就 已 经 设 定好 的 。 


需要 注意 的 是 ， 分 区 键 选择 的 好 坏 会 对 分 区 数据 库 的 性 能 产生 重大 影响 。 如 果 数 据 不 能 相 
对 均衡 地 分 布 在 所 有 数据 库 分 区 中 ， 而 是 部 分 数据 库 分 区 有 大 量 数据 ， 而 其 余 分 区 只 有 少量 数 
据 时 ， 数 据 处 理 的 工作 负载 束 会 集中 在 这 些 拥 有 大 量 数据 的 数据 库 分 区 上 ， 而 其 余 的 数据 库 分 
区 则 基本 上 处 于 空闲 状态 。 这 会 导 任 系统 资源 的 极 大 浪费， 使 数据 库 无 法 达到 它 应 有 的 性 能 。 
分 区 键 的 选择 原则 如 下 : 

首先 ， 对 分 区 键 的 操作 效率 而 言 ， 最 优 的 数据 类 型 是 整数 类 型 ， 其 次 是 字符 型 ， 最 后 是 小 
数 型 。 对 于 所 有 的 长 数据 类 型 (比如 LONG VARCHAR, LONG VARGRAPHICO 和 大 对 象 数 
据 类 型 (比如 BLOB, CLOB, XML) 是 不 能 被 作为 分 区 键 使 用 的 。 
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其 次 ， 从 碍 询 效率 的 角度 来 说 ， 经 常 在 连接 Join) 中 使 用 的 列 是 最 佳 的 选择 。 因 为 这 样 
能 充分 利用 分 区 数据 库 的 特性 ， 使 数据 库 可 以 直接 在 每 个 分 区 中 完成 表 的 连接 (具体 内 容 在 下 
方 中 有 详细 阐述 〉。 
再 次 ， 最 佳 的 分 区 键 选择 是 要 实现 数据 均匀 地 分 布 在 分 区 中 ， 这 样 能 够 将 工作 负载 均 挫 到 
每 个 数据 库 分 区 上 ， 从 而 从 整体 上 提升 数据 库 的 读 号 效率 。 

最 后 ， 切 记 ， 一 定 不 能 使 用 经 党 被 更 新 的 列 作为 分 区 键 。 因 为 分 区 键 的 值 被 更 新 时 ， 会 引 
起 数据 在 分 区 中 的 重新 分 布 ， 将 导 任 系统 的 额外 开销 ， 从 而 影响 数据 库 的 性 能 。 
2. 表 分 区 


表 分 区 是 将 表 中 的 数据 按照 特定 的 列 进行 划分 ， 表 存储 结构 会 根据 所 选 定 的 列 进行 排列 以 
优化 表 的 读 写 ， 同 时 不 同 的 表 分 区 可 以 存放 在 不 同 或 者 相同 的 表 空 间 中 。 这 是 一 种 在 表 的 层面 
进行 数据 分 区 的 技术 。 

创建 表 分 区 的 语法 是 ， 使 用 带 有 PARTITION BY RANGE 子 句 的 建 表 语 句 (CREATE 
TABLE) 。 例 如 下 面 的 语句 ， 创 建 了 表 customer， 并 以 列 shipdate 作为 表 分 区 键 来 对 表 进 行 分 
区 。 其 中 在 “01/01/2011” 和 “03/31/2011” 之 则 的 数据 会 被 存储 在 表 空 间 tsl P, Æ 04/01/2011" 
和 “06/30/2011” 之 间 的 数据 会 说 存储 在 表 空 间 ts2 H, URH. 

CREATE TABLE customer (shipdate DATE, name CHAR(30)) 

IN csi, ES? tS S 


PARTITION BY RANGE(shipdate) (STARTING FROM ('01/01/2011"') 
ENDING AT ('12/31/2011') EVERY (3 MONTHS)) 


使 用 表 分 区 有 以 下 好 处 : 

e 提高 查询 效率 。DB2 优化 器 将 限定 SQL 执行 时 ， 只 访问 WHERE 语句 中 涉及 的 数据 分 
区 ， 避 免 访 问 无 关 数 据 分 区 ， 从 而 提高 了 和 查询 效率 。 

e 可 根据 需要 轻松 地 滚 入 〈Roll-in) MRH 〈Roll-out) 数据 分 区 。 

e 数据 的 压缩 率 不 会 受到 新 数据 的 影响 。 这 是 因为 每 一 个 表 分 区 都 会 有 自己 的 压缩 字典 。 
当 有 新 数据 插入 时 ， 不 会 影响 已 有 数据 分 区 的 压缩 率 。 

3. MDC 


MDC 是 一 种 可 以 按 多 个 维度 把 数据 按照 块 进行 存储 的 技术 ， 它 可 以 把 在 维度 上 有 类 似 值 
的 行 聚集 在 一 起 存放 在 物理 连续 的 块 中 。 当 WHERE、GROUP BY 和 ORDER BY 等 子 句 中 包含 
有 MDC 表 中 定义 的 维度 列 时 ， 查 询 语句 的 执行 效率 可 以 得 到 显著 的 提升 。 

可 以 使 用 带 有 ORGANIZE BY 子 句 的 建 表 语句 (CREATE TABLE) 来 创建 MDC x. 例如 
下 面 的 语句 创建 了 一 个 名 为 mde tbl 的 MDC 表 ，ORGANIZE BY DIMENSIONS 子 句 指出 使 用 
列 region. store 和 year and month 作为 维度 。 

CREATE TABLE mA TOL ( 

Gace TOATE, 

store CHAR(8), 


region CHAR (2), 
year and month generated as INTEGER (date)/100 
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) 
ORGANIZE BY DIMENSIONS (region, store, year and month) 


维度 选择 的 是 否 合适 将 会 对 MDC 表 的 性 能 产生 重大 影响 。 合 适 的 维度 会 显著 地 提升 访问 
MDC 表 的 性 能 ， 而 不 恰当 的 维度 会 使 MDC 表 浪 费 大 量 存储 空间 ， 并 和 带 来 极 差 的 效率 。 在 维度 
的 选择 上 ， 要 遵循 下 而 的 原则 : 

第 一 ， 可 以 选择 经 常 在 谓词 中 使 用 的 列 。 如 上 例 ， 在 商品 销售 表 (mdc tbD 中 定义 了 商品 
信息 (store)、 销 售 时 间 Cyear and month)、 销 售 区 域 Cregion 等 列 。 如果 使 用 销售 区 域 (region ) 
和 销售 时 间 Cyear and month) 7j WHERE 条 件 进 行 SELECT 查询， 那么 由 于 这 两 列 是 MDC 
维度 ， 所 以 在 此 WHERE 条 件 上 的 查询 速度 要 远 远 快 于 非 MDC 方式 存储 的 表 。 

第 二 ， 要 选择 具有 粗 粒 度 的 列 ， 不 能 选择 细 粒 度 的 列 。 比 如 ， 如 果 一 个 时 间 列 中 的 值 精 确 
到 了 日 〈 例 如 ，2011-10-01) , JA xx VUE Sis t EN MDC 表 的 维度 。 由 于 这 种 细 粒 度 的 列 会 
导致 系统 分 配 大 量 的 利用 率 极 低 的 存储 块 来 存储 MDC R. CERNI: TERA, ERT A 
统 性 能 。 如 果 时 间 列 中 的 值 精确 到 月 或 年 〈 例 如 ，2011-10 或 2011) ， 这 样 的 列 就 可 以 被 作为 
MDC 表 的 维度 。 

第 三 ， 查 询 语句 中 ， 被 GROUP BY 或 者 ORDER BY 子 句 使 用 的 列 ， 可 以 被 做 为 MDC 的 
维度 使 用 ， 这 样 能 够 提高 查询 效率 。 

最 后 ， 一 定 要 注意 ， 维 度 的 选择 最 好 不 要 超过 三 个 ， 人 否则 会 降低 系统 性 能 。 


10.2.3 ”多 分 区 环境 下 的 连接 (Join) 策略 


数据 仓库 系统 经 党 需要 对 多 个 大 表 进行 连接 操作 ， 这 就 需要 数据 库 能 够 提供 局 效 的 伍 询 处 
理 能 力 。DB2 提供 的 分 区 技术 可 以 将 数据 在 多 个 分 区 中 平均 分 布 ， 从 而 提高 了 和 玛 询 的 并 行 处 理 
能 力 ， 降 低 了 查询 的 整体 执行 时 间 。 

但 是 ， 在 多 分 区 环境 下 ， 连 接 (Join) 应 当 采 用 什么 样 的 方式 和 使 用 什么 样 的 策略 呢 ? 本 
节 将 讲述 DB2 优化 器 如 何 高 效 地 处 理 多 分 区 环境 下 的 连接 操作 。 

注意 ， 在 下 面 的 讲解 中 统一 使 用 两 个 表 CUST 和 SALES. EF, CUST 是 客户 信息 表 ， 表 
中 定义 了 客户 编号 CCUST ID) 列 ; SALES 是 销售 记录 表 , 表 中 也 定义 了 用 户 编写 (CUST_ID) 
列 ， 与 客户 信息 表 相 关联 ， 并 使 用 同样 的 查询 语句 。 


select * from cust en ee 


还 有 一 点 需要 注意 的 是 ， 在 以 下 图 例 中 ， 表 CUST 中 CUST ID 列 的 值 和 SALES KP 
CUST ID 的 值 ， 分 别 用 圆圈 数字 和 方块 数字 表示 。 例 如 ，CUST 表 中 有 一 条 记录 的 CUST ID 
值 为 1， 则 用 圆圈 1 表示 ; SALES 表 中 有 一 条 记录 的 CUST ID 值 为 1， 则 用 方块 1 表示 。 

1. 并 行 连接 (Collocated joins) 


如 图 10-6 所 示 ， 表 CUST 和 表 SALES 使 用 同样 的 列 〈CUST IDO 作为 分 区 键 ， 并 且 使 用 
同样 的 数据 分 区 图 (Distribution Map) 。 这 两 个 表 中 的 数据 拥有 同样 的 数据 分 布 ， 在 同一 个 分 
区 中 可 以 对 表 中 的 数据 进行 直接 关联 。 

^^ DB2 在 处 理 查 询 语 句 时 , 会 采用 并 行 连接 的 策略 。 即 ， 在 两 个 分 区 中 分 别 对 两 个 表 进行 
连接 ， 在 分 区 间 不 会 有 数据 的 移动 ， 最 终 的 查询 结果 由 两 个 分 区 的 连接 结果 合并 组 成 。 
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2. 直接 连接 (Directed joins) 


如 图 10-7 所 示 ， 表 CUST 使 用 CUST ID 列 作为 分 区 键 ， 表 SALES 使 用 其 他 不 同 的 列 作 
为 分 区 键 。 

在 这 种 情况 下 ，DB2 在 处 理 上 述 碍 询 语句 时 会 采用 直接 连接 。 即 DB2 会 对 表 SALES 中 的 
列 CUST ID 进行 哈 希 ， 并 使 用 表 CUST 的 分 区 图 将 表 SALES 中 的 数据 行 直 接 发 送 到 表 CUST 
所 在 的 数据 库 分 区 上 ， 表 CUST 与 表 SALES 的 连接 将 在 相应 的 分 区 上 进行 。 


表 CUST， 主 键 (CCUST ID) XCUST. XR (CUST ID) 
© © GO o © D 
| | 


表 SALES， 主 键 (CUST ID?) 表 SALES， 主 键 【 其 他 列 ) 
[3] 


图 10-6 采用 并 行 连接 的 数据 分 布 示意 图 图 10-7 采用 直接 连接 的 数据 分 布 示意 图 


3. 广播 连接 (Broadcast joins?) 


如 图 10-8 所 示 ， 表 CUST 不 使 用 CUST ID 列 为 分 区 键 ， 而 使 用 其 他 的 列 ， 表 SALES 使 
用 CUST ID 列 作为 分 区 键 。 其 中 ， 表 CUST 中 的 数据 比较 少 。 

通常 情况 下 ， 当 查询 语句 中 不 包含 相等 连接 的 谓词 时 ，DB2 会 选择 使 用 广播 连接 的 策略 。 
但 是 ， 如 果 查 询 语 句 中 包含 相等 连接 的 谓词 ，DB2 认为 执行 查询 语句 使 用 广播 连接 比 使 用 重 分 
区 连接 CRepartitioned joins) 的 开销 要 少时 ，DB2 也 会 选择 使 用 广播 连接 。 

在 采用 广播 连接 策略 时 ，DB2 先 扫 描 表 CUST， 分 析 连 接 谓词 ， 将 CUST 表 中 的 所 有 数据 
发 送 到 表 SALES 所 在 的 所 有 数据 库 分 区 上 。 然 后 在 各 个 分 区 上 ，DB2 对 表 SALES 进行 扫描 ， 
分 析 谓 词 ， 与 发 送 过 来 的 表 CUST 中 的 数据 进行 连接 。 最 终 各 分 区 将 连接 结果 返回 。 

4. 重 分 区 连接 (Repartitioned joins? 


如 图 10-9 所 示 ， 表 CUST 和 表 SALES 中 的 分 区 键 都 不 是 连接 谓词 中 使 用 的 列 CUST_ID， 
这 时 DB2 采用 重 分 区 连接 策略 ， 即 根据 连接 谓词 中 的 列 (CUST ID) 把 表 CUST 和 表 SALES 
进行 哈 希 运算 ， 然 后 把 两 个 表 中 的 数据 发 送 到 哈 希 运算 后 对 应 的 数据 库 分 区 上 ， 在 这 些 数据 库 
分 区 上 把 表 CUST 和 表 SALES 进行 连接 ， 最 终 各 分 区 把 连接 结果 返回 。 


表 CUST， 主 刍 (其 他 列 ) 表 CUST， 主 键 【 其 他 列 ) 


o O9 © 
| 


表 SALES， 主 键 ( CUST ID) 表 SALES， 主 键 其 他 列 ) 
[3] 
[2] 


图 10-8 采用 广播 连接 的 数据 分 布 示意 图 图 10-9 采用 重 分 区 连接 的 数据 分 布 示意 图 
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10.2.4 ”物化 查询 表 


物化 租 询 表 CMQTO 和 分 区 特性 一 样 ， 都 是 为 提升 数据 仓库 应 用 的 性 能 而 设计 的 。MQT 
的 创建 是 基于 一 个 但 询 结果 ， 它 里 面 存放 的 是 经 过 预计 算得 到 的 结果 。 

创建 MQT 的 命令 如 下 ， 物 化 查询 表 sales prod 是 由 两 个 表 product 和 sales 关联 生成 的 ， 
其 中 表 product 是 产品 表 , 包含 字段 prod id 和 prod desc, 表 sales 是 销售 信息 表 , 包含 字段 prod id 
和 amount, MQT 创建 后 ， 可 以 使 用 “REFRESHTABLE” 命 令 更 新 表 sales prod 的 内 容 。 


CREATE TABLE sales proc AS 
( 
SELECT p- Proa icl, 
P- PrOC_ CeESC,; 
S -o amount 
FROM product p, sales s 
HEERE p-proc icd = $s. prot id 
) 
DATA INITIALLY DEFERRED REFRESH DEFERRED; 


REEFRESH TABLE gales prode 


在 数据 仓库 系统 中 ，MQT 对 下 面 儿 类 复杂 得 询 具有 很 好 的 性 能 : 

e 在 表 中 对 数据 的 聚 类 或 计算 。 

e 表 之 间 的 连接 。 

e 一 个 较 大 表 中 的 子 集 数据 被 频 莹 访问 。 

关于 MQT 的 具体 讲解 、 使 用 方法 和 设计 原则 ， 请 参考 第 $ 章 有 关内 容 。 


10.3 DB2 数据 仓库 设计 


最 近 去 一 家 人 于 保险 公司 进行 数据 仓库 扩 术 服务 ， 发 现 他 们 的 数据 仓库 系统 在 海量 数据 处 
理 方 面 没 有 进行 过 合理 地 设计 ， 没 有 发 挥 出 并 行 处 理 的 优势 ， 此 外 还 注意 到 ， 当 前 DBA 参与 
设计 的 比例 越 来 越 大 了 。 因 此 ， 在 这 一 市 笔者 将 分 译 数 据 仓库 设计 阶段 的 一 些 经 验 。 


10.3.1 BCU/BPU 的 设计 原则 


在 介绍 BCU/BPU 的 设计 原则 之 前 ， 首 先 要 弄 明 白 什 么 是 BPU， 什 么 是 BCU。 


1. BPU (Balanced Partition Unit) 


BPU 是 一 个 逻辑 概念 ， 是 指 服务 于 一 个 DB2 数据 库 分 区 的 一 组 相关 功能 和 相关 系统 资源 。 

如 图 10-10 所 示 ， 一 个 BPU 被 定义 为 一 个 DB2 数据 分 区 和 相关 的 一 些 资源 ， 包 括 DB2 数 
据 分 区 、DB2 Agent, X Agent 服务 的 CPU 和 内 存 ， 以 及 存放 分 区 数据 的 存储 。 

根据 服务 的 不 同 ， 可 以 将 BPU 划分 为 以 下 三 种 类 型 : 

e Data BPU: 用 于 存放 用 户 数 据 的 数据 库 分 区 ; 
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e Coordinator BPU: 用 于 管理 用 户 连接 ， 负 责 协 
调 租 询 的 数据 库 分 区 ; 

e Catalog BPU: 用 于 存放 DB2 编 目的 数据 库 分 区 。 

在 进行 数据 仓库 的 容量 规划 时 ，BPU 非常 有 用 。 比 
如 : 假定 把 一 个 BPU (一 个 DB2 的 数据 库 分 区 ) 配置 为 
可 以 支持 250G 的 裸 数 据 ， 假 定数 据 仓库 总 的 规划 容量 六 
STB 裸 数 据 ， 那 么 整个 数据 仓库 将 需要 32 个 BPU。 利 用 
这 个 数据 可 以 推算 出 相应 的 BCU〈 如 果 一 个 BCU 上 支持 
8 个 BPU， 即 需要 4 个 BCU) 。 由 于 DB2 在 不 同 的 数据 
库 分 区 之 间 平 均 分 配 数 据 和 资源 ,所 以 一 旦 从 CPU、 内 存 、 
VO 等 角度 确定 了 一 个 BPU 的 系统 需求 , 就 可 以 确定 整个 
数据 仓库 的 硬件 配置 。 | 

在 系统 设计 和 实施 阶段 ，BPU 也 非常 有 用 。 可 以 在 EUN a 
BPU 层次 设计 物理 人 硬件、 存储 、 数 据 库 参数 配置 等 ， 然 后 
把 该 BPU 的 配置 映射 到 整个 BCU。 这 样 束 大 大 简化 了 系统 的 初始 设计 、 配 置 、 管 理 、 维 护 等 
A 

2. BCU (Balanced Configuration Unit) 


BCU 是 指 把 CPU、 内存、 存储、 分 区 、 配 置 参数 等 结合 在 一 起 的 、 可 扩展 的 基本 单元 。 
BCU 是 最 小 的 、 可 复制 的 软 便 件 组 合 。 针 对 数据 仓库 系统 ，BCU 保证 了 基础 构架 上 的 扩展 性 ， 
提供 了 磁盘 IO、 内 存 、CPU、 网 络 的 优良 扩展 性 能 。 

BPU 与 BCU 的 关系 ， 如 图 10-11 所 示 : 


图 10-11 BPU 5 BCU 的 关系 示意 图 


BCU 的 类 型 主要 分 为 以 下 两 种 : 
e Data BCU: 是 DB2 数据 库 分 区 的 集合 , 用 于 管理 和 处 理 数 据 库 中 的 用 户 数据 。 一 个 BCU 
支持 一 个 或 多 个 BPU。 
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e Admin BCU: 是 DB2 数据 库 分 区 的 集合 ， 作 为 DB2 的 编目 分 区 (Catalog Partition) ) 和 
协调 节点 CCoordinator Node) 。 


比较 : 编目 分 区 和 协调 市 点 有 什么 区 别 ? 


编目 分 区 (Catalog Partition) 

在 创建 数据 库 的 时 候 ， 数 据 库 管理 系统 会 自动 创建 几 个 表 空 间 ， 其 中 一 个 是 
SYSCATSPACE, 它 用 来 保存 DB2 的 编目 信息 (Catalog ), 在 分 区 数据 库 系 统 中 , SYSCATSPACE 
表 空 间 只 保存 在 一 个 分 区 上 ， 这 个 分 区 就 是 编目 分 区 (Catalog Partition ). 

也 就 是 说 ， 在 哪个 分 区 上 运行 了 创建 数据 库 命令 (CREATE DATABASE )， 对 于 这 个 数据 
库 而 言 ， 该 分 区 就 是 编目 分 区 ，SYSCATSPACE 表 空 间 将 创建 在 该 分 区 上 。 

如 果 想 弄 清 楚 哪 个 分 区 是 它 的 编目 分 区 ， 可 以 使 用 命令 “list db directory”。 在 这 个 命令 的 
返回 信息 中 ， 有 一 项 是 编目 数据 库 分 区 号 (Catalog Database Partition Number )， 它 指出 了 当前 
数据 库 的 编目 分 区 。 当 然 ， 也 可 以 通过 从 不 同 分 区 上 连接 数据 库 ， 然 后 使 用 命令 “list 
tablespaces”， 显 示 SYSCATSPACE 表 空 间 的 分 区 就 是 编目 分 区 。 


协调 节点 (Coordinator Node) 

协调 节点 是 运行 着 协调 代理 (Coordinator Agent) 的 分 区 ， 任 意 一 个 分 区 都 有 可 能 成 为 协 
JPE. 

在 DB2 中 ， 协 调 代 理 (Coordinator Agent) 与 应 用 进行 交互 ， 负 责 接 收 请 求 和 返回 结果 ， 
它 可 以 自己 处 理应 用 的 请 求 或 者 将 工作 布置 给 多 个 副 代理 (Subagent) 处 理 。 

协调 节点 可 以 通过 命令 SET CLIENT CONNECT _ NODE 来 指定 , 当 应 用 发 出 一 个 查询 要 求 ， 
协调 节点 将 查询 请 求 发 送 给 其 他 分 区 上 的 副 代 理 ， 各 个 分 区 上 的 副 代 理 将 各 自 的 结果 返回 给 协 
调 巴 点， 由 协调 节点 把 查询 结果 聚合 后 返回 给 应 用 。 


在 BCU 的 设计 中 ， 一 个 最 重要 的 设计 原则 是 分 离 管理 器 BPU 和 数据 BPU， 让 它们 独立 承 
担 各 目的 工作 。 典 型 的 BCU DB2 数据 库 设 计 ， 如 图 10-12 所 示 ， 该 示例 中 ， 定 义 了 一 个 管理 
BCU (包含 一 个 管理 BPU) ， 两 个 数据 BCU 〈 各 包含 8 个 数据 BPU) 。 


LPAR 7? - DATA BCU LPAR 3 - DATA BCU 


4 , 
I Kig "nw 
eir err ES ^ 
AD zl 1 | 
EE hi "T 
er * ww Bp "T 
i 
| 
|. 
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图 10-12 BCU 的 设计 示意 图 
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管理 器 BPU 是 一 个 DB2 数据 库 分 区 ， 它 主要 有 以 下 三 个 角色 : 

e 你 存 数据 库 的 编目 表 ; 

e 扮演 协调 节点 ， 响 应 用 户 连 接 ; 

e 存储 小 型 表 和 没有 分 区 的 表 。 

数据 BPU 同样 也 是 DB2 数据 库 分 区 ， 它 的 主要 职责 是 负责 存储 被 分 区 的 表 数 据 。 


10.3.2 ”数据 BPU 上 存储 划分 


每 一 个 数据 BPU 都 有 目 己 的 数据 库 引 擎 、 数 据 库 和 内存、 数据 库 日 志和 锁 ， 并 且 要 独立 地 
操作 一 组 数据 子 集 。 所 有 的 数据 BPU 应 该 拥有 同等 数量 的 数据 。 这 样 会 你 证 每 一 个 数据 库 分 
区 在 处 理 但 询 时 上 共有 同样 的 工作 负载 ， 也 束 古 在 处 理 一 条 俘 询 时 ， 所 有 的 数据 库 分 区 都 同时 
MT Rs 

从 CPU 和 内 存 的 角度 来 看 ,数据 BPU 是 一 个 人 效 辑 实体 ， 因 为 数据 BPU 所 使 用 的 内 存 和 线 
程 ， 并非 归 这 个 数据 BPU 固定 占有 和 使 用 ， 而 是 由 操作 系统 动态 分 配 。 也 网 是 说 ， 在 一 合 服务 
器 上 的 任意 一 个 CPU,， 会 为 在 这 合 服务 器 上 的 任意 数据 库 进 程 服 务 ， 因 此 CPU、 内 存 等 系统 资 
源 独 立 于 运行 该 进程 的 数据 库 分 区 。 

关于 存储 的 设计 ， 原 则 是 保证 每 一 个 数据 BPU 都 有 属于 目 己 的 一 组 物理 磁盘 ,， 并且 保 证 数 
据 仓 库 中 的 所 有 数据 对 象 都 均匀 地 分 布 在 这 些 磁盘 上 。 这 种 设计 模式 ， 可 以 保证 每 个 BPU 中 的 
所 有 数据 对 象 ， 在 BPU 中 都 会 均等 地 进行 VO 操作 。 


10.3.3 ”数据 库 的 文件 系统 划分 


关于 数据 库 使 用 的 文件 系统 的 设计 原则 ， 对 于 BPU， 建 议 创建 不 同 的 文件 系统 用 来 存放 数 
据 库 中 不 同 的 信息 ， 人 例如， 设计 四 个 独立 的 文件 系统 Cdb2path, db2fs. db2plog. db2mlog) 分 
别 存放 数据 库 实例 、 表 空间 、 主 日 志 以 及 镜像 日 志 。 在 每 个 文件 系统 下 ， 根 据 实例 名 Cinstance 
name) 创建 属于 不 同 BPU 的 文件 系统 。 

1. /db2path/instancename/NODEOOON 


这 个 文件 系统 是 BPU N 的 数据 库 目 录 。 注 意 ， 如 果 N=10， 文 件 系 统 的 命名 为 /db2path/ 
instancename/NODE0010. 


2. /db2fs/instancename/NODEOOON 


这 个 文件 系统 存放 BPU N 上 的 所 有 永久 的 或 临时 的 表 衬 间 容 器 。 在 BPU 0 上 ， 它 对 应 的 
文件 系统 同时 也 存放 看 数据 库 的 编目 表 。 

在 每 个 数据 仓库 的 节点 上 都 会 创建 命名 为 /db2fs/instancename/NODE000 N/db2dump 的 文件 
系统 ， 用 来 存放 诊断 日 志文 件 。 同 样 的 软 连接 /db2fs/instancename/db2dump 作为 诊断 日 志 参 数 
DIAGPATH 的 值 , 设 症 在 所 有 的 管理 市 点 和 数据 节 扣 上， 而 这 些 连接 指 问 每 一 个 市 点 的 诊断 日 
记 子 目录 。 

3. /db2plog/instancename/NODEOOON 


这 里 保存 着 BPU N 的 主 日 志 。 
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4. /db2mlog/instancename/NODEOOON 
这 里 存放 着 BPU N 的 镜像 日 志 。 

10.3.4 仓库 中 诞生 的 数据 库 
可 以 使 用 以 下 语句 创建 数据 仓库 中 的 数据 库 : 


CREATE DATABASE testdb ON /db2fs DBPATH ON /db2path PAGESIZE 16384 
DFT EXTENT SZ 16 AUTOCONFIGURE APPLY NONE; 


注意 : testdb 是 数据 库 的 名 字 ， 执 行 上 述 命令 的 分 区 束 被 称 作 编目 分 区 。 

使 用 这 条 语句 创建 数据 库 时 ， 同 时 意味 看 : 

(1) 开局 了 数据 库 的 目 动 存储 管理 功能 。 

(2) 路 径 /db2A 作为 所 有 的 日 动 存储 表 空间 的 容器 。 

(3) 路 径 /db2path 作为 数据 库 的 目录 。 

(4) Buffer pool 和 表 空 间 的 默认 页 大 小 为 16KB。 

C5) 默认 的 扩展 块 大 小 为 16 个 页 ， 也 就 是 说 ， 当 页 大 小 为 16KB 时 ， 扩 展 块 大 小 为 
256KB. 


10.3.5 ”数据 库 分 区 组 的 设计 


在 创建 DB2 数据 库 的 同时 ， 下 面 这 三 个 默认 的 数据 库 分 区 组 会 被 自动 创建 。 
e IBMCATGROUP: 这 个 数据 库 分 区 组 用 于 存放 编目 表 。 该 分 区 组 只 创建 在 一 个 数据 库 
分 区 上 ， 可 以 指定 它 保存 在 0 号 数据 库 分 区 上 。 
e IBMTEMPGROUP: 这 个 分 区 组 在 所 有 的 数据 库 分 区 上 都 有 ， 系 统管 理 的 默认 临时 表 
空间 TEMPSPACE1 就 保存 在 这 里 。 
e IBMDEFAULTGROUP: 当 数 据 库 创建 后 ， 这 个 分 区 组 是 默认 的 表 空 间 分 区 组 ， 如 果 在 
创建 表 空 间 时 不 指明 分 区 组 ， 丈 使 用 这 个 分 区 组 。 这 个 分 区 组 包含 数据 库 实例 中 所 有 
的 数据 库 分 区 。 另 外 ， 它 包含 着 一 个 名 为 USERSPACEI 的 表 空 间 ， 当 用 户 创建 表 时 ， 
如 不 指明 表 空 间 ， 都 会 默认 地 把 表 建 在 这 个 表 空 间 中 。 
除了 上 面 默 认 的 分 区 组 外 ， 还 会 创建 用 户 分 区 组 。 分 区 组 的 名 称 可 以 自行 设 定 ， 本 例 中 命 
名 为 SDPG 和 PDPG. 分别 用 于 管理 BPU 和 数据 BPU: 
e SDPG: 存放 单 分 区 数据 ， 并 用 于 管理 所 有 BPU 的 分 区 组 。 这 个 分 区 组 只 包含 一 个 数 
据 库 分 区 ， 即 数据 库 分 区 0 (BPU 0) 。 
e PDPG: 存放 分 区 数据 的 分 区 组 。 这 个 分 区 组 只 包含 数据 BPU， 用 来 保存 用 户 数 据 。 
创建 上 述 分 区 组 的 命令 如 下 ， 假 设 有 1 个 管理 BPU 和 16 个 数据 BPU， 管 理 BPU 是 第 1 
个 数据 库 分 区 ， 即 分 区 号 为 0， 数据 分 区 包括 分 区 1~ 分 区 16. 
CREATE DATABASE PARTITION GROUP SDPG ON DBPARTITIONNUMS (0); 
CREATE DATABASE PARTITION GROUP PDPG ON DBPARTITIONNUMS (1 TO 16); 


数据 库 分 区 组 的 设计 情况 如 图 10-13 Brzn : 
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IBMDEFAULTGROUP 


IBM TEMPGROUP 


PDPG 


IBMCATGROUP 


图 10-13 ”数据 库 分 区 组 的 设计 示意 


10.3.6 缓冲 池 的 设计 


数据 库 管 理 需 使 用 绥 冲 池 对 数据 进行 缓存 ， 对 于 每 一 个 表 至 间 页 面 的 大 小 ， 必 须 至 少 有 一 
个 相同 页 大 小 的 缓冲 池 存 在 。 因 些 ， 与 表 空 间 一 样 ， 绥 冲 池 的 页 大 小 也 有 4KB、8KB、16KB 
和 32KB. 


人 注意 : 缓冲 池 的 数量 不 用 太 多 
在 数据 仓库 中 ， 缓 冲 池 的 数量 不 用 太 多 ! 这 是 因为 数据 库 管理 器 对 单一 缓冲 池 中 的 
数据 、 索 引 和 临时 页 管理 起 来 具有 更 高 的 效率 。 如 果 一 个 环境 中 定义 了 多 个 缓冲 池 ， 数 
据 库 管理 必须 判断 出 哪个 缓冲 池 有 更 多 的 页 ， 确 保 每 个 缓冲 池 达 到 了 它 的 最 高 效率 ， 这 
就 增加 了 额外 的 消耗 。 


维 表 、 字 典 表 通 币 保存 在 管理 BPU E, BPFE N, MAREM PES E E o 
如 末 这 些 类 型 的 数据 也 要 保存 在 数据 节点 上 ， 采 用 一 个 独立 的 缓冲 池 会 有 更 局 的 效率 。 

创建 基于 块 的 绥 冲 池 也 是 一 个 很 重要 的 选择 。 基 于 块 的 绥 冲 池 由 块 区 域 和 页 区 域 组 成 。 在 
块 区 域 中 有 指定 数量 的 连续 页 ， 用 来 处 理 连续 预 读 的 工作 ; 页 区 域 用 来 处 理 其 他 所 有 的 VO 工 
作 。 推 荐 保留 三 分 之 一 的 绥 冲 池 用 作 块 区 域 。 

使 用 基于 块 的 绥 冲 池 ， 在 有 预 读 需 要 时 ， 通 过 块 IO 可 以 提升 顺序 谈 和 全 表 扫 描 的 性 能 。 
顺序 谈 时 ，DB2 的 预 读 机 制 将 磁盘 上 临近 的 块 读 入 连续 的 内 存 页 中 ， 预 读 机 制 采 用 的 块 IO 的 
Ar e TAA IIET R vo. 


10.3.7 ”数据库 日 志 的 设计 


如 果 数 据 库 分 区 中 的 一 个 或 多 个 表 空间 需要 被 重建 ， 可 以 通过 在 此 分 区 上 的 备份 介质 进行 
恢复 并 执行 roll-forward 操作 。 因 此 , 建议 把 单个 分 区 的 表 空间 容器 和 活动 日 志保 存在 不 同 的 存 
储 上 。 


429 


DB2 设计 、 管 理 与 性 能 优化 艺术 


通过 设置 数据 库 配 置 参数 NEWPATHLOG 重新 指定 日 志文 件 的 存放 位 置 ,下面 的 命令 将 日 
志 的 默认 位 置 改 为 /db2plog/bcuaix: 


db2 update db cfg for bcudb using NEWLOGPATH /db2plog/bcuaix; 


需要 注意 的 是 , 在 给 参数 NEWPATHLOG 设置 了 值 之 后 , 路 径 /NODENNNN (其 中 , NNNN 
是 分 区 的 编号 , 例如 第 9 号 分 区 就 是 NODE0009) 会 被 自动 增加 到 参数 NEWPATHLOG 的 值 后 ， 
这 样 某 个 节点 的 实际 日 志 存 放 位 置 为 /db2plog/bcuaix/NODENNNN。 


Aa tE: 关于 镜像 日 志 的 设计 

从 数据 库 的 层面 上 看 ， 镜 像 日 志 是 在 活动 日 志 被 意外 删除 或 者 外 部 存储 出 现 数据 破 
损 的 情况 下 ， 保 证 还 有 额外 的 镜像 文件 作为 活动 日 志 ， 从 而 确保 数据 库 正 常 运 行 。 

在 设置 镜像 日 志 后 ， 每 一 个 日 志文 件 会 被 同时 写 两 份 ， 如 果 数 据 库 的 主 日 志文 件 无 
法 写 入 时 ， 数 据 库 会 标识 主 日 志文 件 为 坏 文件 ， 并 且 继 续 将 日 志 写 入 镜像 文件 。 在 执行 
回 滚 或 者 前 滚 操作 时 ， 数 据 库 服务 器 会 自己 判断 哪个 日 志文 件 可 用 。 

如 下 所 示 ， 可 以 通过 设 定 参数 MIRRORLOGPATH 来 启用 镜像 文件 。 例 如 ， 将 值 
/db2mlog/bcuaix 赋 给 该 参数 后 ， 路 径 /NODENNNN 会 被 自动 添加 到 镜像 参数 值 的 后 面 ， 
这 也 就 是 镜像 日 志 在 节 点 上 的 实际 存放 位 置 。 


db2 update db cfg for bcudb using MIRRORLOGPATH /db2mlog/bcuaix; 


10.3.8” 表 空间 的 设计 


对 于 用 户 表 空间 ， 推 荐 使 用 目 动 存储 管理 。 
可 以 使 用 如 下 命令 创建 一 个 横路 所 有 数据 BPU 的 数据 库 管 理 类 型 (DMS) KEH. 


CREATE TABLESPACE TS BIG IN DATABASE PARTITION GROUP PDPG BUFFERPOOL BP 16K; 


这 个 表 空 间 默 认 的 页 大 小 是 16K， 默 认 的 扩展 大 小 为 16 个 页 ， 默 认 的 预 取 大 小 为 384 页 ， 
它 使 用 缓冲 池 BP 16K. 
人 注意 : 默认 的 表 空 间 是 哪个 ? 
在 创建 表 时 ， 设 计 原 则 要 求 在 create table 命令 中 明确 指出 使 用 哪个 表 空 间 (Table 
Space )， 然 而 ， 很 多 应 用 在 开发 时 并 没有 在 建 表 语句 中 显 式 地 指定 所 使 用 的 表 空 间 ， 这 
种 情况 下 ,DB2 会 使 用 默认 分 区 组 IBMDEFAULTGROUP 中 的 默认 表 空 间 USERSPACEI 
REX] PU. 


10.3.9 ” 表 的 存放 技巧 


对 于 数据 量 不 同 的 表 ， 通 常 表 的 存放 技巧 也 各 不 相同 。 

对 于 大 表 , 强烈 推荐 将 这 类 表 存 放 在 路 所 有 数据 BPU 的 独立 表 空间 里 , 另外 也 结合 使 用 表 
分 区 和 MDC 技术 。 

对 于 中 型 表 ， 这 类 表 可 以 按 人 逻辑 分 组 ， 五 六 个 或 更 多 一 点 的 表 存 放 在 一 个 表 空 间 上 ， 这 些 
表 空 间 也 要 横 跨 所 有 数据 BPU。 同 一 个 表 空 间 上 的 表 ， 最 好 在 逻辑 上 有 一 定 的 关系 ， 例 如 所 有 
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数据 都 是 同一 个 部 门 的 。 这 类 表 的 索引 ， 可 以 存放 在 与 数据 相同 的 表 空 间 中 ， 也 可 以 独立 存放 。 
对 于 小 型 表 ， 多数 这 类 表 会 被 放 在 单一 分 区 的 表 空 间 上 , 通常 位 于 管理 BPU b. 5b WX 
据 存 放 在 同一 个 表 空 间 中 。 
对 于 物化 查询 表 ，(MQT) 和 其 他 数据 库 对 象 , 这 类 对 象 通常 会 被 存放 在 独立 的 表 空 间 上 ， 
这 个 表 衬 间 横 路 所 有 数据 BPU. 


10.3.10 ”数据 压缩 


数据 仓库 中 面 对 爆 发 性 增长 的 海量 数据 ， 你 会 选择 如 何 处 理 ? 增加 外 部 存储 设备 吗 ? 增加 
存储 设备 可 以 解决 这 个 问题 ， 但 是 需要 大 量 资金 投入 。 可 以 试想 一 下 有 没有 其 他 更 有 效 、 更 经 
济 的 方法 。 

在 很 多 实际 场景 中 ， 有 了 时候 会 发 现 这 些 海量 数据 存在 大 量 见 余 。 如 果 将 这 些 见 余 的 数据 用 
数据 字典 中 的 数据 代替 ， 驶 会 减少 很 多 空间 占用 ， 这 就 是 数据 压缩 。DB2 支持 数据 行 级别 的 压 
缩 ， 它 采用 基于 静态 数据 字典 的 压缩 原理 对 数据 行进 行 压 缩 。 在 行 级 别 的 压缩 中 ， 如 果 一 行 中 
多 个 列 值 的 匹配 模式 是 重复 的 ， 则 DB2 会 使 用 较 短 的 标记 字符 串 进行 蔡 换 。 

在 数据 仓库 中 ， 强 烈 推荐 使 用 数据 压缩 功能 ， 这 可 以 带 来 很 多 好 处 。 

首先 ， 可 以 降低 系统 对 存储 空间 的 要 求 。 通 常 ， 表 的 压缩 比 为 50% 到 60%， 当 然 这 依赖 于 
表 中 的 具体 数据 。 

其 次 ,通过 压缩 可 以 提高 UO 性 能 。 虽 然 压 缩 会 耗费 更 多 的 CPU 时 间 来 进行 压缩 或 解压 缩 ， 
但 却 降低 了 UO 需求 。 所 以 ， 通 常 对 于 CPU 比较 空闲 而 IO 存在 瓶 宽 的 系统 ， 使 用 压缩 来 提高 


效率 。 
最 后 ， 通 过 压 乡 可 以 节省 存储 空间 ， 进 而 节省 能 源 ， 减 少 热量 的 排放 ， 符 合 绿色 环 你 、 持 
续 发 展 的 社会 主题 。 


从 V9.7 版 本 开始 ，DB2 开始 引入 了 索引 压缩 ， 可 以 通过 表 函 数 ADMIN GET INDEX - 
COMPRESS INFO 评 佑 索引 的 压缩 效果 。 只 有 在 对 索引 有 显著 的 压缩 率 时 才 建 议 使 用 。 通 第， 
由 于 唯一 性 索引 的 压缩 效果 不 太 好 ， 上 所 以 不 主张 对 它 进 行 压 缩 。 

此 外 ， 在 对 DB2 数据 库 进 行 备 份 (BACKUP) 时 ， 也 可 以 通过 压缩 加 快 备份 速度 。 


10.4 数据 仓库 实战 


有 许多 用 户 对 搭建 数据 仓库 感觉 信心 不 足 ， 实 际 上 是 因为 没 把 握 住 其 中 的 要 所。 其 实 只 要 
掌握 在 上 一 节 中 讲解 的 设计 原则 与 方法 ，DB2 数据 仓库 的 搭建 加 会 游 思 有余 了 。 

本 节 将 以 客户 实战 环境 为 基础 ， 结 合 前 面 讲 的 原则 与 方法 ， 详 细 介 绍 搭建 数据 仓库 的 具体 
1E T 


2V PR o 


10.4.1 硬件 环境 


本 例 中 的 环境 ， 是 通信 行业 中 某 公 司 的 真实 环境 ， 采 用 了 3 台 IBM Power 740 服务 嚣 ，9 
台 IBM DS3500 作为 外 部 存储 器 。 有 具体 的 硬件 配置 情况 ， 以 及 网 络 拓扑 结构 如 图 10-14 所 示 。 
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IBM Power 740 服务 器 的 配置 为 128G 内 


f£. Wii 8 Ei POWER7 CPU. == inii in 
IBM DS3500 存储 : 24 块 300GB 容量 的 Iwriwm 0| | cmm 
SAS 标准 硬盘 ， 采 用 RAID6 磁盘 阵列 技术 。 TA eem um 
主机 与 存储 之 间 使 用 SAN 网 络 连 接 。 有 关 IE iid 
RAID 技术 和 SAN 网 络 技术 不 属于 本 书 涉及 | 
的 范围 ， 有 兴趣 的 读者 可 以 查阅 相关 文档 。 主机 名 : aD? i ini 
根据 10.3 节 中 的 设计 原则 ， 结 合 人 硬件 情 -—— — B o it fttit 
况 ， 作 出 如 下 的 总 体 规划 : == 
首先 ,根据 对 客户 数据 量 和 数据 仓库 工作 I Foer TO 
负载 的 分 析 ， 将 一 台 Power 740 部 署 为 管理 图 10.14 硬件 配置 和 网 络 括 扑 图 


BCU， 设 定 为 分 区 0 (分 区 号 为 0) ， 承 担 编 
目 市 点 和 协调 节点 的 功能 ， 并 且 存 储 所 有 非 分 区 数据 ， 从 而 保证 能 为 客户 提供 u 高 效 的 数据 交互 
H& 7J o 
其 次 ， 在 其 余 的 两 台 Power 740 L4 3553L—-4 ^ 20448 BCU， 每 个 BCU 上 规划 8 个 数据 库 分 
区 (也 就 是 数据 BPU) ， 这 样 ， 两 台 Power 740 上 总 共有 16 个 数据 分 区 ， 分 区 号 依次 为 1-16. 
最 后 ， 存 储 采 用 RAID6 磁盘 阵列 技术 ， 这 样 能 为 客户 提供 高 效 的 数据 可 靠 性 保证 。 管 理 
BCU 使 用 的 三 块 存储 空间 ， 分 别 用 于 存储 数据 、 存 放 日 志文 件 和 实例 目录 ; 在 数据 BCU 使 用 
的 每 个 存储 器 上 划分 出 两 个 存储 空间 ， 分 别 为 两 个 数据 库 分 区 提供 存储 服务 。 更 细节 的 内 容 请 
参看 下 面 的 具体 实现 。 


10.4.2 ”实例 的 规划 与 实施 


完成 了 对 BCU/BPU 的 规划 后 ， 下 面 要 完成 对 数据 仓库 中 实例 〈Instance) 的 规划 与 实施 ， 
这 一 步 的 工作 包括 安装 DB2， 设 置 共享 实例 目录 ， 创 建 数据 库 用 户 和 用 户 组 ， 以 及 创建 实例 。 
具体 步骤 如 下 : 
CI) 安装 DB2 
本 例 中 共有 三 台 服 务 器 ， 分 别 是 dwdb01、dwdb02 和 dwdb03， 以 root 权限 分 别 登 录 上 述 
三 台 服 务 器 ， 运 行 db2 install， 把 DB2 安装 到 默认 目录 /opt/ibm/db2 下 。 
(2) 创建 DB2 主 文件 系统 
以 root 权限 登录 服务 占 dwdb01， 创 建 实例 共享 目录 /db2home， 用 于 存放 数据 库 实例 。 


A 注意 : 为 什么 需要 db2home 文件 系统 ? 
在 dwdb01 上 创建 的 DB2 数据 库 用 户 的 主 目录 放置 在 文件 系统 /db2home 中 作为 共享 
路 径 ， 它 会 被 服务 器 dwdb02 和 dwdb03 挂 载 。 这 样 ， 这 三 台 服 务 器 可 以 使 用 同一 个 数据 


库 实例 。 


(3) 确认 NFS 是 否 运 行 
在 DB2 数据 仓库 环境 中 ， 所 有 的 服务 器 使 用 同一 个 DB2 主 文件 系统 ， 所 以 首先 使 用 NFS 
(Net FileSystem) 在 dwdb01 上 导出 (export) 路 径 /db2home， 然 后 在 dwdb02 和 dwdb03 服务 
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器 上 挂 载 (mount) 路 径 /db2home。 
先 来 检查 一 下 NFS 的 状态 。 在 两 台 机 器 上 分 别 运 行 lssrc -g nfs MA, Mie NFS 是 否 在 两 
人 台 服 务 器 上 正常 运行 ， 合 令 如 下 : 


F lssre =g nfs 


Subsystem Group PID Status 
biod nig 217262 active 
rpc.statd nfs 295060 active 
rpc.lockd nfs 282780 active 


可 以 看 到 rpe.statd 和 rpc.lockd 两 个 进程 都 在 运行 。 
À 注意 :共享 文件 系统 ， 不 使 

搭建 DB2 多 分 区 环境 (DPF) 时 ， 需 要 在 两 台 服 务 器 上 使 用 共享 的 文件 系统 作为 数 
据 库 的 实例 目录 。NEFS 是 实现 这 种 文件 共享 机 制 的 一 种 方式 。 

先 来 看 看 NFS 的 优势 和 不 足 。 使 用 NES 实现 共享 文件 系统 非常 简便 ， 它 是 操作 系统 
4A, ALERUB. (83 NES LAE, dub NES HL AHAERCUEA. NES 
存在 服务 端 和 客户 端 ， 当 NFS 的 服务 端 宕 机 后 ，DPF 环境 就 前 溃 了 ; 宕 机 后 ， 重 启 NFS 
EE 其 他 服务 器 必须 趣 载 (umount) 共享 的 实例 目录 /db2home， 否 则 会 启动 失败 ，。 

么 还 有 别 的 方式 吗 ?” 实 际 上 除了 NFS 之 外 ， 还 可 以 使 用 IBM 的 并 行文 件 系 统 
onis. OPES ZAA AAEH I ROBUR EAR MIA 并 且 允 许 
所 有 节点 共享 这 些 数据 文件 ， 也 允许 并 行 的 应 用 程序 从 GPFS 节点 组 (nodeset) 中 的 任 
何 节 点 访问 Mn 文件 。 

GPFS 的 各 个 节点 是 平等 的 ， 具 有 高 性 能 和 可 扩展 性 ， 同 时 也 具有 高 可 用 性 和 可 恢 
复 性 , 不 会 因为 一 个 节点 宕 机 影响 到 整个 文件 系统 ,从 而 比 使 用 NFS 具有 更 高 的 可 靠 性 


A 小 技巧 ， 不 使 用 共享 文件 系 

LEA—T, AG T 

B "ccsuc52 
/db2home， 那 么 这 三 台 服 务 器 对 该 共享 文件 系统 均 可 以 访问 ， 也 就 是 说 ， 它 们 访问 的 是 
人 

既然 使 用 共享 文件 系统 就 是 为 了 保证 dwdb01、dwdb02 和 dwdb03 这 三 台 服 务 器 访 
问 相 同 的 内 容 ， 假 如 不 使 用 共享 文件 系统 ， 而 是 将 服务 器 dwdb01 上 的 文件 夹 原封 不 动 
的 复制 到 服务 器 dwdb02 和 dwdb03 上 ， 也 就 达到 了 同样 的 效果 。 

在 DB2 的 分 区 数据 库 中 ， 数 据 库 用 户 的 主 目录 /db2home 是 共享 的 ， 如 果 把 该 目录 
原 模 原 样 地 复制 到 其 他 的 服务 器 上 ， 同 样 可 以 居 动 分 区 数据 库 。 有 一 点 需要 注意 的 是 ， 
如 果 数 据 库 节点 发 生 改 变 ， 需 要 及 时 更 改 并 保证 所 有 服务 器 上 目录 /db2home 下 的 文件 
db2nodes.cfg 内 容 保 持 一 致 。 

了 最后， 不 推荐 大 家 使 用 非 共 享 文件 的 方式 搭建 分 区 数据 库 。 


diei sin pai ia 
在 服务 器 dwdb01 上 导出 DB2 主 文件 系统 “/db2home” 
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本 例 使 用 的 是 AIX 操作 系统 ， 输 入 命令 smit nfs， 选 择 “Network File System (NFS) ”并 
按 回 车 ， 选 择 “Add a Directory to Exports List” 并 按 回 车 ， 在 “Pathname of directory to export” 
中 输入 要 叶 出 的 跨 符 “/db2home”。 

在 “Hosts allowed root access” 中 输入 服务 器 dwdb02 和 dwdb03 的 名 称 或 地 址 。 

(5) 在 dwdb02 和 dwdb03 服务 器 上 挂 载 路 径 /db2home 

在 服务 器 dwdb02 和 dwdb03 上 挂 载 服务 器 dwdb01 上 导出 的 文件 系统 “/db2home”。 

输入 命令 smit nfs, 选择 “Network File System (NFS) ”并 按 回 车 , 选择 “Add a File System 
for Mounting” 并 按 回 车 ， 在 “Pathname of mount point” ~ “Pathname of remote directory" 和 

“Host where remote directory resides” 中 分 别 输 入 本 地 的 挂 载 点 /db2home， 远 端的 挂 载 点 

/db2home， 以 及 远 端 主机 的 地 址 或 主机 名 。 


WE "Security method” 为 “sys”。 


WE "/etc/filesystems entry will mount the directory on system restart” 为 “yes”。 
WE "Mode for this NFS file system" 7j *read-write" . 


WE "Mount file system soft or hard" 7j “soft” . 


人 小 技巧 ， 验 证 各 台 服务 器 上 /db2hor 
在 服务 器 dwdb01 的 /db2home 中 创建 文件 abc.txt， 然 后 登录 服务 器 dwdb02， 在 
/db2home 中 也 能 看 到 该 文件 。 
在 服务 器 dwdb02 上 删除 文件 abc.txt, 在 主机 dwdb01 的 /db2home 中 ,可 以 看 到 abc.txt 
文件 已 经 被 删 挤 。 


(6) 创建 DB2 使 用 的 用 户 和 用 户 组 
根据 规划 ， 系 统 将 只 创建 一 个 生产 实例 BCUAIX， 在 该 实例 下 创建 数据 库 DWDB。 每 台 服 
2r s RUE. 8 个 多 辑 分 区 ， 两 合 服务 器 共有 16 个 数据 库 分 区 。 
本 实例 中 创建 的 数据 库 用 户 和 用 户 组 ， 以 及 每 个 用 户 或 用 户 组 的 作用 ， 如 表 10-2 所 示 : 


X 10-2 用 户 和 用 户 组 的 定义 
用 户 名 /组 名 D 
db2admgp 实例 管理 组 Group aa 
dbzfengp — | Wi 组 | Grup — | - | 
db2dasgp Group | 
Bouaix 600 
db2fencl 610 
db2das 620 


在 三 台 服 务 器 dwdb01、dwdb02 和 dwdb03 上 ， 用 户 名 和 用 户 组 名 完全 相同 ， 分 别 在 这 三 
台 服 务 器 上 运行 下 面 的 命令 : 


mkgroup id=600 db2admgp 
mkgroup id=610 db2fengp 
mkgroup id=620 db2dasgp 
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mkuser id=600 pgrp-db2admgp groups-db2admgp home-/db2home/bcuaix bcuaix 
mkuser id-2610 pgrp-db2fengp groups-db2fengp home-/db2home/db2fencl db2fencl 
mkuser id-2620 pgrp-db2dasgp groups-db2dasgp home-/db2home/db2das db2das 


人 
y VN FERE: \ 4 | 
除了 上 面 的 用 户 名 和 用 户 组 名 完全 相同 外 ,相应 的 用 户 ID def P 28 ID 也 必须 相同 ， 
这 是 因为 操作 系统 实际 上 是 以 ID 来 识别 用 户 和 用 户 组 的 。 


(7) 编辑 服务 器 dwdb01、dwdb02 和 dwdb03 的 /db2home/bcuaix/.rhosts 文件 ， 增 加 下 面 
的 内 容 ， 实 现 三 台 服 务 器 间 在 beuaix 用 户 环境 下 相互 信任 ,， 这样 使 得 bcuaix 用 户 在 这 三 台 服 务 
器 上 互相 访问 无 顷 再 输入 密 码 。 
dwdb01 bcuaix 


dwdb02 bcuaix 
dwdb03 bcuaix 


G 注意 : 在 所 有 服务 器 上 必须 配置 rsh 
rsh 必须 在 每 台 机 器 上 都 要 配置 。 这 样 才 能 保证 dwdb01、dwdb02 或 dwdb03 服务 器 

上 的 用 户 可 以 通过 fsh 访问 另外 一 台 服 务 器 。 
在 服务 器 dwdb01、dwdb02 和 dwdb03 上 ， 分 别 修改 文件 /etc/xinetd.d/rsh。 如 下 所 示 : 


sşseryice shell 


l 


pool ctype = stream 
wait = no 
Useri cEOQ 


log on success t= USERID 
Logronio ae eU ERT 
server =- /usr/sbin/in.rshd 
disable - no 


} 


(8) 创建 DB2 实例 
在 dwdb01 上 以 root 权 限 登 录 , 使 用 下 述 命令 创建 实例 .DB2 实例 创建 成 功 后 ,在 用 户 beuaix 
的 主 目录 下 会 出 现 sqllib 的 目录 。 


db2icrt -s ese -u db2fencl bcuaix 


(9) 分 别 在 服务 器 dwdb01、dwdb02 和 dwdb03 上 为 DB2 实例 指定 服务 端口 。 分 别 编辑 
文件 /etc 人 /services， 增 加 以 下 内 容 。 
2 


DE20 Ca 60000/tcp 
DE MO oan cde D — (6:01 E S qe ero 


其 中 ，DB2c bcuaix 是 用 做 TCP/IP 3845 WNE, mO 50000; DB2 bcuaix 和 
DB2 bcuaix END i X ft dis FE IN e oy bc TR] pe Eng XR fu Hym O E X. DB2 bcuaix 和 
DB2 bcuaix END 分 别 是 起 始 端口 和 结束 端口 ， 本 例 中 共 保 留 了 17 AmA, ARAR 17 个 
数据 库 分 区 提供 服务 。 
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C100 配置 实例 bcuaix 的 db2nodes.cfg， 内 容 如 下 : 


dwdb01 
dwdb02 
dwdb02 
dwdb02 
dwdb02 
dwdb02 
dwdb02 
dwdb02 
dwdb02 
dwdb03 
dwdb03 
dwdb03 
dwdb03 
dwdb03 
dwdb03 
dwdb03 
16 dwdb03 


ORONO Oy dE OO [7] €» 


e erer 
A w N P|P O 


n 
O1 
e (O» (Uu dE (G3 | eE €S «ln C» (Oud wm G5 SY [L2 €» O 


G1) 更 改 实例 通 讯 参 数 如 下 : 


db2 update dbm cfg using SVCENAME DB2c bcuaix 
db2set db2comm - tcpip 


(120. 验证 实例 是 否 创建 成 功 。 


通过 下 面 的 步骤 ， 验 证 一 下 实例 是 否 创建 成 功 。 

(D 使 用 bcuaix 用 户 登 录 服 务 器 dawdb01， 执 行 命 令 db2samp1， 创 建 样本 数据 库 sample. 
© 使 用 db2 connect to sample 命令 连接 到 数据 库 sample. 

© 使 用 select 或 其 他 soL 语句 操作 sample 数据 库 中 的 数据 。 

© 使 用 db2 drop database sample 删除 sample 数据 库 。 


10.4.3 ”数据库 的 规划 与 实施 


数据 仓库 中 完成 对 实例 的 创建 ， 仅 仅 完 成 了 第 一 步 ， 还 需要 按照 10.3 市 中 的 设计 原则 ， 继 
续 对 数据 仓库 中 的 数据 库 进 行规 划 和 实施 ， 下 面 让 我 们 开始 吧 。 

第 一 步 ， 规 划 管 理 节 点 和 数据 和 点 的 文件 系统 ， 以 及 数据 库 文件 的 存储 策略 。 

CIO 管理 节点 的 文件 系统 规划 

在 整体 规划 中 ， 划 定 了 管理 节点 连接 一 台 外 部 存储 ， 在 存储 上 划分 出 三 个 存储 空间 ， 分 别 
用 于 存放 数据 、 存 放 日 记 和 保存 实例 数据 ， 上 有 具体 示 意图 如 下 图 10-15 所 示 。 

图 10-15 中 文件 系统 的 划分 ， 能 够 非常 明晰 地 区 分 各 文件 系统 的 职能 (其 中 bcuaix 是 实例 
名 ) ， 例 如 : 

/db2fs/bcuaix/NODE0000， 用 来 存放 分 区 0 上 的 永久 和 临时 表 空 间 ， 同 时 也 用 来 存放 数据 
库 的 编目 文件 。 

/db2path/bcuaix/NODE0000， 用 来 存放 分 区 0 的 数据 库 目 录 。 

/db2mlog/bcuaix/NODE0000， 用 来 存放 分 区 0 的 镜像 日 志文 件 。 

/db2plog/bcuaix/NODE0000， 用 来 存放 分 区 0 的 主 日 志文 件 。 这 里 需要 注意 的 是 ， 这 个 文 
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件 系统 使 用 的 是 设备 HDISK7, 目的 是 为 了 将 主 日 志文 件 与 镜像 日 志文 件 (存放 在 设备 HDISK6 
中 ) 分 布 在 不 同 的 设备 控制 器 上 ， 这 样 可 以 保证 当 一 个 设备 控制 器 出 现 故 障 时 ，DB2 TJ n 
外 一 份 日 志文 件 可 以 使 用 。 

/db2home 是 实例 的 共享 目录 。 


E - MEM EYES 文件 系统 

Eo : — E ass 
i ! 二 i i : 
haspo = Idb2ts/bcuax/NODEOD000 
BN i 
: f Mpathp0 -i> /db2path/bcuaix/NODEO000 
1 | ! ! 

hdisk& 7*| i | | 
:Cp wvmipo — -L———* /db2miog/bcuaix/NODE0000 
ME EE : 
| Mpipo 上 > idb2plog/bcuab/NODEO000 
| i| | 
| d | 

hdisk7 | | 
: | 

hdiskB (— — — — > idp2home 
: | 


EE TE ET CE TE EI CE TEET TETI I TE TT 


图 10-15 管理 节点 的 文件 系统 规划 


(2) 数据 节点 的 文件 系统 规划 

根据 对 数据 节点 的 规划 ， 每 个 数据 节点 连接 4 台 DS3500， 每 个 数据 节点 上 规划 了 8 个 数 
据 库 分 区 ， 这 样 每 台 外 部 存储 满足 两 个 数据 库 分 区 。 上 所 有 的 数据 分 区 都 规划 有 4 个 文件 系统 
( /db2fs/bcuaix/NODENNNN, ，/db2path/bcuaix/NODENNNN /db2mlog/bcuaix/NODENNNN , 
/db2plog/bcuaix/NODENNNNO ， 其 中 NNNN 是 分 区 的 编号 。 

与 数据 分 区 对 应 的 文件 系统 的 规划 ， 如 下 图 10-16 所 示 ， 每 台 DS3500 划分 出 两 个 设备 。 
以 设备 HDISK7 为 例 ， 该 设备 上 的 文件 系统 划分 如 下 : 
BESS RERO 文件 系统 


' [] ü " 
i 

i : -i i 

1 r] 1 1 


DS3500 


Ivísp7 iul /db2ts/bcuaix/NODEO007 
i 
: | Ivpathp7 NS /db2path/bcuaix/NODEO007 | 
JaA I: uu ; On : 
©-J©-/C-C-|C- |C- |: Mmlpg | :5—*  db2miog'bcuaix/NODEOO09 


wu . Idb2plogbcuaiw NOD 
= E0005 \ 


wispa mi> /db2is/bcuaiuNODEO008 


-— ^. idb2path/bcuaix/'NODEO008 
lvpathps | | ! 


Ivmipio i 7 DNE 


—— /db2plog/bcuab/NODEOO008 
J : i 
a i 1 
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/db2fs/bcuaix/NODE0007， 用 来 存放 分 区 7 上 的 永久 和 临时 表 空 间 。 

/db2path/bcuaix/NODE0007， 用 来 存放 分 区 7 的 数据 库 目 录 。 

/db2mlog/bcuaix/NODE0009， 用 来 存放 分 区 9 的 镜像 日 志文 件 。 

/db2plog/bcuaix/NODE0005， 用 来 存放 分 区 5 的 主 日 志文 件 。 

需要 注意 的 是 ，HDISK7 上 存放 的 是 分 区 7 的 数据 文件 、 分 区 5 的 主 日 志文 件 和 分 区 9 的 

镜像 日 志文 件 ， 而 分 区 7 的 日 志文 件 放 在 其 他 人 磁盘 设备 上 。 这 样 可 以 避免 读 写 同 一 人 磁盘 设备 数 
据 文件 和 日 志文 件 时 出 现 IO 竞争 。 此 外 , 把 主 日 志文 件 和 镜像 日 志文 件 存放 在 不 同 的 磁盘 上 ， 
是 为 了 确保 当 某 个 磁盘 出 现 故 隐 时 还 有 另外 一 份 日 志文 件 可 以 使 用 。 

第 二 步 ， 创 建 数 据 库 、 数 据 库 分 区 组 和 组 剖 池 。 

CIO 创建 数据 库 

下 面 的 命令 中 ， 创 建 了 一 个 名 为 dwdb 的 数据 库 ， 其 中 /db2fs 指定 了 存放 表 空 间 的 位 置 ， 
/db2path 指定 了 数据 库 的 创建 位 置 。 


CREATE DATABASE dwdb ON /db2fs DBPATH ON /db2path USING CODESET GBK TERRITORY CN 


(20 创建 数据 库 分 区 组 
下 面 的 命令 创建 了 两 个 数据 库 分 区 组 ， 其 中 PDPG 用 于 存放 横 跨 所 有 数据 分 区 的 表 ， 数 据 
分 区 编写 从 1 到 16; SDPG 是 蛙 分 区 的 分 区 组 ， 只 包含 分 区 0。 


CREATE DATABASE PARTITION GROUP PDPG ON DBPARTITIONNUMS (1 TO 16); 
CREATE DATABASE PARTITION GROUP SDPG ON DBPARTITIONNUMS (0); 


(35 创建 和 修改 缓冲 池 
下 面 的 命令 创建 了 大 小 约 为 4.5GB 的 绥 冲 池 ， 其 中 1.5GB 定义 为 块 区 域 。 


CREATE BUFFERPOOL BP 16K ALL DBPARTITIONNUMS SIZE 300000 PAGESIZE 16K 
NUMBLOCKPAGES 100000 BLOCKSIZE 16; 


第 三 步 ， 在 执行 完 上 述 操作 后 ， 需 要 重新 配置 一 下 数据 库 日 志 的 存放 位 置 。 
C15 使 用 下 面 的 命令 设置 默认 的 DB2 日 志 存 放 位 置 


db- update db cfg for DOudbO using NENTOCGFPATH Ael] lCocd be 


(2) 镜像 日 六 的 存放 位 置 也 需要 重新 配置 

db2 update db cfg for bcudb using MIRRORLOGPATH /db2mlog/bcuaix; 
第 四 步 ， 创 建 表 空间 。 

(1) 创建 一 个 模 跨 所 有 数据 分 区 的 表 空 间 TS. BIG 


CREATETTABLESEACET ES BIG IN DATABASE CARTITETONTOROUP T EDECTBUFERRPOOLTBE TICK 
OVERHEAD 4.0 TRANSFERRATE 0.04; 


(2) 创建 一 个 单 分 区 的 表 空 间 TS SMALL 


CREATE TABNESPACE TS SMALL IN DATABASE PARTITTON GROUP SDPG BURFEERPOOGL BP-TOK 
OVERHEAD 4.0 TRANSFERRATE 0.04; 
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本 例 中 在 创建 表 空 间 时 ， 使 用 了 OVERHEAD 和 TRANSFERRATE 两 个 参数 。 通 俗 地 讲 ， 
OVERHEAD 值 是 指 磁 盘 驱 动 器 从 接 到 指令 到 找到 数据 所 花费 的 时 间 《〈 单 位 是 坚 秒 ) ， 
TRANSFERRATE 值 是 指 把 表 空 间 的 一 个 页 从 硬盘 读 入 内 存 花 费 的 时 间 “【〈 单 位 是 毫秒 ) 。 优 化 
器 进行 优化 查询 时 ,会 结合 OVERHEAD 值 和 TRANSFERRATE 值 综合 考量 磁盘 LO 消耗 的 时 
间 。 使 用 不 同 技术 参数 的 人 硬盘 时 ， 对 上 述 两 个 值 的 设 定 也 是 不 同 的 ， 用 户 需 要 根据 实际 情况 进 
行 设 定 。 如 果 不 指定 这 两 个 值 ，DB2 V9 之 后 的 版 本 将 采用 默认 值 ，OVERHEAD 的 默认 值 是 
7.5 毫秒 ，TRANSFERRATE 的 默认 值 是 0.06 毫秒 。 


10.44 ”参数 设置 

数据 库 配 置 参数 对 数据 仓库 的 性 能 有 很 大 的 影响。 不 同 的 人 硬件 环境 、 应 用 特点 以 及 工作 负 
载 ， 决 定 了 数据 库 配 置 参 数值 的 差异 性 。 因 此 ， 设 置 DB2 参数 不 能 照 猎 画 虎 ， 生 搬 硬 套 ， 而 应 
该 根据 具体 情况 ， 设 置 合适 的 值 ， 以 保证 数据 仓库 的 高 性 能 。 

以 下 列 出 的 有 关 参 数 配 置 ， 只 是 针对 本 例 环 境 和 应 用 场景 设置 的 ， 希 望 对 读者 的 实际 工作 
提供 一 些 参考 。 

1. DB2 注册 变量 的 设置 

关于 注册 变量 参数 的 相关 知识 ， 请 参考 本 书 7.1.4 节 。 

(1) 指定 TCP/IP 为 实例 的 通信 协议 。 


db2set DB2COMM-TCPIP 


(2) 指定 DB2 优化 器 把 包含 “NOT EXISTS” 查 询 语句 翻译 成 anti-join 形式 ， 可 以 达到 
提升 处 理 速 度 的 目的 。 


db2set DB2 ANTIJOIN-Y 
(3) 指定 DB2 优化 右 采 用 扩展 的 优化 方式 提升 得 询 性 能 。 


db2set DB2 EXTENDED OPTIMIZATION=ON 


(4) 指定 所 有 表 空 间 均 局 用 并 行 JO， 由 于 没有 指定 表 空 间 使 用 的 磁盘 数 ， 将 使 用 默认 的 
做 盘 数 6。 不 恰当 的 便 盘 并 行 效 值 设 置 ， 可 能 会 导致 IO 性 能 降低 。 不 同 的 存储 设备 和 不 同 的 
RAID 划分 方法 ， 取 得 最 佳 性 能 的 设置 值 也 会 不 同 。 


cloZ seu IDE PARALLEL TO 


对 于 设置 该 值 的 最 佳 实现 方法 是 ,用户 在 实际 环境 中 使 用 Linux/Unix. 系统 中 的 磁盘 测速 工 
具 ， 测 试 出 UO 性 能 最 佳 的 数值 。 
2. 实例 配置 参数 的 设置 


天 于 实例 配置 参数 的 相关 知识 ， 请 参考 本 书 7.1.2 Fo 

(1) 设 定 在 实例 范围 内 允许 私有 排序 占用 的 最 大 内 存 容量 。 

数据 仓库 系统 中 ， 排序、 连接 等 操作 需要 使 用 大 量 的 排序 堆 。 通 第 可 以 先 设 定 一 个 初始 值 ， 
在 系统 运行 过 程 中 通过 数据 库 快照 观测 内 存 使 用 情况 再 做 调整 。 如 下 所 示 : 
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db2 update dbm cfg using sheapthres 1400000 


(2) 让 数据 库 目 动 管理 数据 库 内 部 消息 通讯 所 需 的 缓冲 区 数目 。 


clo2 update clom ctg using FCM NUM BUFFERS AUTOMATIC 


(3) 设 定 通信 端口 。 
clo2 update com ctg using SYCENAME DB2C bocuaix 
(4) 指定 数据 库 诊 断 日 志 的 存放 路 径 。 


db2 update dbm cfg using DIAGPATH /db2fs/bcuaix/db2dump 
3. 数据 库 配 置 参 数 的 设置 


关于 数据 库 配 置 参 数 的 相关 知识 ， 请 参考 本 书 7.1.3 8. 

CIO 插入 或 者 删除 一 条 记录 所 生成 的 锁 的 大 小 约 为 224 宇和 节 ， 在 一 个 数据 分 区 上 回 表 中 
插入 10 万 条 记录 时 ， 需 要 大 概 22M 的 锁 空 间 (100000x224 字 节 ) ， 需 要 设 定 LOCKLIST fü 
为 22M/4K = 5600。 当 前 系统 LOCKLIST 设 定 为 16384， 即 锁 空 间 大 约 为 64MB。 


db2 all "db2 update db cfg for dwdb using LOCKLIST 16384" 


(2) WR MAXLOCKS 的 值 设置 的 太 小 ， 容 易 导 致 锁 升 级 ， 从 而 影 啊 并 发 性 。 本 例 设 置 
值 为 10， 可 以 确保 当 并 发 插入 3 万 条 记录 没有 提交 时 ， 也 不 会 引起 锁 升 级 。 


Glo all el update GD ctg ftor GOWGID using MAXLOCKS 10% 


(3) 设置 排序 扒 的 大 小 。 


db2 all "db2 update db cfg for dwdb using SORTHEAP 35000" 


(40 数据 仓库 系统 中 ， 大 量 的 插入 事务 操作 会 产生 大 量 的 日 志 ， 如 果 日 志文 件 的 大 小 设 
置 的 比较 小 ， 会 因 归 档 旧 日 志 、 分 配 新 日 志文 件 等 操作 增 大 系统 开销 ， 进 而 影响 数据 库 系 统 的 
性 能 。 可 通过 参数 LOGFILSIZ 设置 日 志文 件 大 小 ， 命 令 如 下 : 


db2 all "db2 update db cfg for dwdb using LOGFILSIZ 12800" 


(5) 主 日 志 是 按照 LOGFILSIZ 的 大 小 预 分 配 日 志文 件 的 ， 可 以 根据 便 盘 容量 和 LOGFILSIZ 
的 大 小 设 定 合理 的 主 文件 数量 。 需 要 注意 的 是 ， 如 果 主 文件 数量 太 少 ， 未 提交 的 长 事务 可 能 导 
致 日 志文 件 被 写 满 ， 进 而 会 影响 DB2 的 正常 运行 。 副 日 志文 件 在 本 例 中 不 局 用 。 


Glle all "dio2 update clo etg ftor el using LOGPRIMARY 50" 
com all "dioz upäate clo ctg for welo using LOGSECOND 0* 


10.4.5 ”其 他 操作 
1. 设置 操作 系统 的 字符 集 


应 客户 要 求 ， 数据 库 使 用 中 文学 符 集 ， 所 以 在 bcuaix 用 户 的 .profile 中 添加 以 下 内 容 ， 用 来 
指定 当前 服务 器 在 bcuaix 下 使 用 的 字符 集 ， 你 证 DB2 正常 运行 。 
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export LC ALL-zh CN 


2. 更 新 AIX 的 环境 设置 


为 了 避免 DB2 的 性 能 受到 影响 ， 需 要 设置 AIX 系统 中 用 户 的 最 大 进程 数 (maxuproc) 为 
4090 。 
通过 下 面 命令 否 看 当前 maxuproc 的 值 ， 发 现 当 前 值 为 128。 


lsattr -El sys0|grep maxuproc 


maxuproc 128 Maximum number of PROCESSES allowed per user True 


使 用 下 面 的 命令 更 改 maxuproc 为 4096， 并 再 次 查看 。 


root:/db2home # chdev -1 sys0 -a maxuproc-'4096' 
sys0 changed 
root: /dob2home  Lsatte ul sysOlgrep mazuproec 


maxuproc 4096 Maximum number of PROCESSES allowed per user True 


3. 设置 TCP / IP 网 络 参 数值 


N Y iub e ^y bC2BU PEZ TR] ESRB TG 068 EE 2) DUIS PET E FR A Ro ds E. SR CAU P 
所 示 的 参数 。 需 要 注意 的 是 ， 下 列 参数 所 设置 的 值 是 推荐 的 最 小 值 ， 如 果 你 的 系统 中 东 个 参数 
己 经 设置 了 一 个 比 下 列 数 值 更 大 的 值 ， 可 以 继续 使 用 该 值 ， 无 须 进 行 修改 。 


thewall = 65536 

sue max = 1310720 

EucH o 

cep sendspace = 221164 
cep recyspace = 221164 
udo sendspace = 63536 
udo recyspace = 65936 


somaxconn = 1024 


Aa 小 技巧 : 如 何 更 改 TCP / IP 网 络 参数 值 
(1) 查看 当前 相关 的 网 络 参 数 ， 可 使 用 命令 no -a | more。 
例如 ， 查 看 tcp sendspace 的 当前 值 : 


root:/db2home # no -a | grep tcp sendspace 


cep sencspace = 160364 
(2) 设置 其 中 的 某 项 参数 ， 则 需要 使 用 no -o parameter name = «value». 
例如 : 设置 tcp sendspace 的 值 为 221184， 并 进行 查看 : 


root:/db2home # no -o tcp sendspace=221184 
setting cp sendspace c© 221164 


Change to tunable tep sendspace, will only be effective for future OO QUOS ECTS 


root:/db2home 4 no -a | grep tcp sendspace 


tcp sendspace — 221184 
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4. 开启 Oracle 兼容 模式 


为 了 方便 用 户 将 已 有 的 Oracle 应 用 轻松 迁移 到 DB2 环境 中 ， 在 创建 数据 库 前 需要 进行 下 
述 操作 ， 以 开启 DB2 的 Oracle 兼容 模式 。 

-- 开启 兼容 Oracle 的 模式 

db2set DB2 COMPATIBILITY VECTOR=ORA 

db2set DB2 DEFERRED PREPARE SEMANTICS=YES 

-- 重新 启动 DB2, 创建 数据 库 

db2stop 


db2start 
db2 CREATE DATABASE DWDB 


人 注意 : 数据 仓库 中 必须 开启 Oracle ; 

Oracle 兼容 模式 可 以 方便 用 户 将 Oracle 应 用 迁移 到 DB2 环境 中 。 但 是 , 在 数据 仓库 
中 并 非 必 须 开 启 兼 容 模 式 ， 

如 果 之 前 并 没有 建设 过 数据 仓库 ， 而 是 需要 从 头 开始 搭建 一 个 基于 DB2 的 数据 仓 
È, RRRA LZH È Oracle 兼容 模式 。 

如 果 之 前 有 Oracle 数据 仓库 系统 ， 现 在 打算 将 其 迁移 到 DB2 上 ， 那 么 可 以 考虑 开 
启 Oracle 兼容 模式 。 这 样 , 以 前 基于 Oracle e 应 用 就 可 以 非常 便捷 地 迁移 到 DB2 
Se 


10.5 工作 负载 管理 (WLM) 


在 数据 仓库 的 日 常 运 维 工作 中 ， 对 系统 中 的 重要 资源 进行 监控 ， 对 负载 过 高 的 相关 资源 进 
行 调 整 ， 束 能 做 到 “ 防 患 于 未 然 ”。 

DB2 工作 负载 管理 (WLM) 是 实现 上 述 目标 的 有 力 武 器 。WLM 用 来 对 工作 任务 进行 实时 
监控 、 管 理 资源 和 任务 优先 级 ， 从 而 避免 因 工 作 任务 无 序 竞争 而 导致 的 系统 性 能 下 降 。 

这 里 重点 讲解 在 数据 仓库 环境 下 ,如 何 针对 复杂 得 询 运用 DB2 WLM 提供 的 负载 管理 能 力 。 


10.5.4 ”管理 已 知 的 工作 负载 


如 果 一 个 工作 负载 的 类 型 可 以 通过 它 最 初 的 来 源 判 定 ， 例 如 申 哪个 用 户 运 行 或 者 来 自 哪个 
应 用 ， 这 样 束 可 以 方便 地 为 工作 负载 指定 优先 级 别 和 并 行 限制 。 

下 面 的 例子 里 定义 了 两 个 新 的 服务 类 ， 一 个 共有 高 优先 级 ， 另 一 个 具有 低 优先 级 。 控 制 已 
知 工作 负载 来 源 的 操作 步骤 如 下 : 

(1) 设置 默认 系统 类 的 优先 级 别 。 

如 下 所 示 ， 其 中 AGENT PRIORITY 用 于 定义 使 用 CPU 的 优先 级 ， 合 理光 围 为 - 20-20, 
- 20 为 最 蜗 优 先 级 ，20 为 最 低 优 先 级 ， 下 面 设置 为 - 20 表示 最 高 优先 级 : 


elo2 imst i @Qawelo:s +> olor VALTER SERVICE CLASS SYSDEPAULTSYSTEMCLASS AGENT PRTORITY o 
DB20000I The SoL command completed successfully. 
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Ai 注意: AGENT PRIORITY 在 
在 DB2 V10 中 ,AGENT PRIORITY 不 再 推荐 使 用 ,相应 的 代替 技术 是 WLM Dispatcher. 
这 是 一 种 新 的 调度 CPU 资源 的 技术 ， 感 兴趣 的 读者 可 以 阅读 DB2 信息 中 心 相关 内 容 。 


(2) 创建 两 个 服务 类 ， 一 个 用 于 重要 的 用 户 和 应 用 ， 另 一 个 用 于 普通 的 用 户 和 应 用 。 这 
样 一 来 ， 就 可 以 将 系统 中 不 同 的 工作 负载 划分 到 相应 的 服务 类 。 

下 面 的 命令 中 ， 将 来 源 是 “db2bp”、 用 户 是 “BCUAIX” 的 应 用 定义 为 高 优先 级 别 。 将 来 
源 是 “db2batch” 的 应 用 定义 为 低 优先 级 别 。 


clo2insti@awolo: => cloz? VCREATE SERVICE CLASS LOW PRIO”; 

DB20000I The SoL command completed successfully. 

@lle pm cwn PME SERVICE CLASS HIGH PRIO"; 

DB20000I The SQL command completed successfully. 

iio msi ewe => cloz VCREATE WORKLOAD HIGH PRIO APPLNAME ("cloz") SYSTEM USER 
("BCUAIX") SERVICE CLASS HIGH PRIO"; 

DB20000I The SQL command completed successfully. 

clo ms ee el aec Clo2 VOREATE MORKLOAD LOW PRIO NM a olloyZtexs edel 0) SERVICE CLASS 
LOW PRIO"; 

DB20000I The SoL command completed successfully. 

eio? mme UC USAGE ON WORKLOAD MIGH PRIO TO PUBLIC™; 

DB20000I The SQL command completed successfully. 

clordstiatsus TEC col oto ecc Coz? OSTSEE IP USAGE ON WORKLOAD LOW PRIO TO PUBLIC™ g 

DB20000I The SoL command completed successfully. 


注意 ， 用 户 名 需要 大 写 。 应 用 的 名 字 要 区 分 大 小 ,应 和 命令 “LIST APPLICATIONS” rp i 
示 出 来 的 “Application name” 列 一 样 。 

(3) 将 服务 类 “HIGH PRIO” 设 置 为 第 二 高 优先 级 别 的 类 。 

注意 ， 用 户 定义 的 服务 类 的 优先 级 别 必 须 低 于 系统 默认 的 优先 级 别 ， 在 第 一 步 中 ， 系 统 默 
认 的 优先 级 别 为 “ - 20”。 所 以 将 日 定义 的 服务 类 “HIGH PRIO” 的 优先 级 别 设 置 为 “- 19”。 


@lle 2 eel velo => cloz VALTER SERVICE CLASS HIGH BRITO AGENT PRIORITY =19 PREFETCH PRIORITY HIGHA 
DB20000I The SQL command completed successfully. 


(40 通过 下 面 的 命令 ， 将 服务 类 “LOW_PRIO” 设 置 为 最 低 优先 级 别 的 类 。 


eio nmstdwelu ATERSET C CTSS ON OGHNIE RU 
DB20000I The SQL command completed successfully. 


(50 设置 服务 类 LOW_PRIO I] E 4E fi 2 d KE Az tx AC 20. 


@lo2 imst i @Qawelo: => edo YCREATE THRESHOLD QUEUEL FOR SERVICE CLASS ATTON EER TON 
> ACTIVITIES ENFORCEMENT DATABASE 

> WHEN CONCURRENTDBCOORDACTIVITIES > 20 

CONAN 

DB20000I The SQL command completed successfully. 


10.5.2 ”管理 不 可 预见 的 工作 负载 
如 果 无 法 从 来 源 区 分 工作 负载 的 类 型 ， 那 么 可 以 使 用 一 个 估计 值 来 控制 这 些 工 作 负载 。 每 
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当 一 个 工作 负载 开始 在 系统 中 运行 时 ，WLM 会 根据 完成 它 所 需要 的 时 间 和 资源 估计 一 个 系统 
开销 。 基 于 估计 的 系统 开销 ， 工 作 负 载 会 被 划 归 于 一 个 服务 类 中 。 

HARE WU P. 

CD. 设置 默认 的 系统 服务 类 (SYSDEFAULTSYSTEMCLASSO 的 优先 级 为 最 高 级 别 。 


db2 => alter service class sysdefaultsystemclass agent priority -20 ^ 
Gl92 (cont. .) => buffterpool priority high prefetch priority high 
DB20000I The SoL command completed successfully. 

db2 => commit 

DB20000I The SQL command completed successfully. 


注意 ， 服 务 类 的 优先 级 别 必须 低 于 默认 的 系统 服务 类 。 
(2) 创建 一 个 新 的 服务 超 类 〈 名 为 superclass) ， 并 针对 大 、 中 、 小 型 的 查询 任务 创建 三 
个 子 类 【名字 分 别 为 highcost class. middlecost class FH lowcost class) . 


db2 => create service class superclass 

DB20000I The SoL command completed successfully. 

db2 => commit 

DB20000I The SQL command completed successfully. 

db2 => alter workload sysdefaultuserworkload service class superclass 

DB20000I The SoL command completed successfully. 

db2 => commit 

DB20000I The SQL command completed successfully. 

de “= er SF Servicoc class highcost class under osuperelbassc^N 

db2 (cont.) => collect aggregate activity data extended 

DB200001 The SQL command completed successfully. 

db2 => commit 

DB20000I The SQL command completed successfully. 

dB —- create servsce class middlecost class under superclass nn, 

db2 (cont.) => collect aggregate activity data extended 

DB20000I The SQL command completed successfully. 

db2 => commit 

DB20000I The SoL command completed successfully. 

db a reae ee lss lowcost elass Unocr uperela es 

db2 (cont.) => collect aggregate activity data extended 

DB20000I The SQL command completed successfully. 

db2 => commit 

DB200001 The SQL command completed successfully. 

db2 => alter service class sysdefaultsubclass under superclass collect aggregate 
activity data extended 

DB20000I The SoL command completed successfully. 

db2 => commit 

DB20000I The SQL command completed successfully. 


(3) GE ST] LTE2S, JPTR DE EW HS REC AE TT I f e 


cloz2instil@ewelo:s => cloz YCREATE WORK CLASS SET CONTROL COST 

(WORK CLASS LowCost WORK TYPE DML FOR TIMERONCOST FROM 0 TO 60000, 

WORK CLASS MiddleCost WORK TYPE DML FOR TIMERONCOST FROM 60000 to 2000000, 
WORK CLASS HighCost WORK TYPE DML FOR TIMERONCOST FROM 2000000 TO UNBOUNDED)"; 
DB20000I The SQL command completed successfully. 
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eio 2mm ewe ee P "CREATE WORK ACTION SET QUERY COST FOR SERVICE CLASS SUPERCLASS 
USING WORK CLASS SET CONTTFOL COST 

(WORK ACTION MAP HighCost ON WORK CLASS HighCost 

MAP ACTIVITY TO MignCost CLASS, 

WORK ACTION MAP MiddleCost ON WORK CLASS MiddleCost 

MAP ACTIVITY TO MidaleCost CLASS, 

WORK ACTION MAP LowCost ON WORK CLASS LowCost 

MAP ACTIVITY TO LOWCOST CLASB)™? 

DB20000I The SQL command completed successfully.; 


Y Y Y Y Y y M 


(4) 为 不 同 资源 消耗 的 工作 类 创建 并 发 限制 。 
O 为 系统 消耗 局 的 类 定义 并 行 限 制 。 


9 

> FOR SERVICE CLASS HighCost CLASS under SUPERCLASS ACTIVITIES 

> ENFORCEMENT DATABASE 

> WHEN CONCURRENTDBCOORDACTIVITIES > 10 AND QUEUEDACTIVITIES UNBOUNDED 
ONAN 

DB20000I The SỌL command completed successfully. 


D 为 系统 消耗 低 的 类 定义 并 行 限制 。 


GlassdeleleoE Clo2 VCREATE THRESHOLD limit Concur le 

> FOR SERVICE CLASS MiddleCost_CLASS under SUPERCLASS ACTIVITIES 

> ENFORCEMENT DATABASE 

> WHEN CONCURRENTDBCOORDACTIVITIES > 30 AND QUEUEDACTIVITIES UNBOUNDED 
CONAN 

DB20000I The SoL command completed successfully. 


(5) 为 开销 局 的 闫 设置 低 优先 级 别 。 


le 

> PREFETCH PRIORITY LOW AGENT PRIORITY 20"; 

DB20000I The SoL command completed successfully. 

db2instlGdwdb:-» db2 "ALTER SERVICE CLASS MiddleCost CLASS under SUPERCLASS 
» AGENT PRIORITY 10"; 

DB200001 The SQL command completed successfully. 


(6) 在 DB2YV9.7 中 ， 如 条 系统 开销 的 估计 值 不 准确 ， 可 以 创建 一 个 国 值 来 降低 工作 负载 
的 优先 级 别 。 在 下 例 中 ， 类 “LowCost CLASS" "pie LTEJEARBISI RE ARERI, n Rt 
消耗 超过 预 估 的 CPU 资源 ， 该 查询 工作 将 被 重新 映射 到 较 低 的 类 。 


iio» ewe cS DS THRESHOLD SUPERCLASS L2M 

EOR SERVICE CLASS LOWCOSE CLASS under SUPERCLASS ACTIVITIES 
ENFORCEMENT DATABASE PARTITION 

WHEN CPUTIMEINSC > 5 SECONDS CHECKING EVERY 1 SECONDS 
REMAP ACTIVITY TO MiddleCost_CLASS 

LOG EVENT MONITOR RECORD"; 

DB20000I The SQL command completed successfully. 


Y Y Y yY Yy 


dio» mm sl cwo IPC SS THRESHOLD SUPERCLASS M2M 
> FOR SERVICE CLASS duBLolod eC ose CLASS UNDER SUPERCLASS ACTIVITIES 
> ENFORCEMENT DATABASE PARTITION 
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> WHEN CPUTIMEINSC > 30 SECONDS CHECKING EVERY 10 SECONDS 
> REMAP ACTIVITY TO HMignCost CLASS 

> LOG EVENT MONITOR RECORD" 

DpDB20000rT The SOL command completed successfully. s 


10.5.3 ”管理 并 行 的 LOAD 工作 负载 


在 使 用 LOAD 命令 进行 数据 加 载 时 ， 对 CPU 资源 和 LO 资源 的 需求 很 大 ， 尤 其 在 对 MDC 
表 和 分 区 表 进 行 数 据 加 载 时 ， 需 要 大 量 的 CPU 资源 和 LO 资源 。 

为 了 避免 因为 LOAD 工作 抢占 数据 库 过 多 的 资源 ， 进 而 影响 整体 系统 性 能 ， 所 以 需要 限制 
LOAD 的 并 行 数 量 。 下 面 的 例子 中 ， 将 控制 LOAD 操作 的 并 行 数量 最 多 设置 为 2。 接 下 来 讲解 
一 下 具体 实现 。 

(1) 针对 LOAD 操作 ， 定 义 一 个 独立 工作 类 。 


lloilo rci VCREATE WORK CLASS SET LOAD TYPE 
> (WORK CLASS LOAD WC WORK TYPE LOAD)" 
DB20000I The SQL command completed successfully. 


(2) 限定 LOAD 操作 的 并 行 数目 最 多 为 2 个， 语句 如 下 : 


eios ewe ERaoOREAUERNORKRESGCIIONRSEURECONIIROTEIOADRORRRDAESEBIASEE 
> USING WORK CLASS SET LOAD TYPE 

> (WORK ACTION LIMIT LOAD ON WORK CLASS LOAD WC 

> WHEN CONCURRENTDBCOORDACTIVITIES > 2 AND QUEUEDACTIVITIES UNBOUNDED 
CONO 

DB20000I The SQL command completed successfully. 


通过 上 述 的 设 定 ， 可 以 有 效 地 减少 LOAD 工作 对 系统 资源 的 占用 ， 从 而 避免 整体 系统 性 能 
的 降低 。 


10.5.4 监控 工作 负载 


在 DB2 中 ， 可 以 创建 监控 器 来 监控 工作 负载 的 运行 情况 ， 从 而 发 现 潜 在 的 性 能 问题 。 监 控 
工作 负载 的 具体 步骤 如 下 : 
(1) 使 用 下 面 的 语句 创建 表 空 间 MONITOR， 用 于 存放 WLM 用 到 的 相关 表 ， 这 个 表 空 间 
创建 在 IBMDEFAULTGROUP 数据 库 分 区 组 中 。 


CREATE TABLESPACE MONITOR MAXSIZE 10G; 


(2) DB2 WLM 中 共有 三 种 不 同类 型 的 监控 方式 ， 分 别 为 : 

e 统计 事件 监控 : 用 于 收集 所 有 活动 事件 的 统计 信息 。 

e 活动 事件 监控 : 用 于 收集 某 个 特定 类 的 活动 事件 的 信息 ， 同 时 也 用 于 收集 超越 闵 值 的 
活动 事件 的 信息 。 

e KEFE: 用 于 收集 被 超越 的 闵 值 信息 。 

使 用 下 面 的 命令 分 别 创 建 这 三 种 不 同类 型 的 事件 监视 器 用 于 上 述 监 控 。 

CD 创建 统计 事件 监视 器 。 
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db2 => create event monitor wlm stats for statistics \ 


de2 conte) > wiiee to tacle 

oDe T on E a ae a a a eao oa 

加 “人 

We ee ET 

gi M conu Eo wm obses Or Eo E 

lo2 (cont.) => hnistogramoin ( table wim stats histogram in monitor ); \ 
clo  (eom.) omreol oo wimiststs CODEEOI mm. X 

db2 (cont.) c autostart 


DB20000I The SQL command completed successfully. 
db2 => commit 
DB20000I The SQL command completed successfully. 


D 创建 活动 事件 监视 器 。 


db2 => create event monitor wlm event for activities write to table \ 


Ho mu ccm M aCtivity ( table wlm eyent in monitor), \ 

o eom.) a a iile wiw. ewewE O EOE) x 
clo2 ccn M actiyvyityvals ( table wlm eyent yvals in monitor), \ 
pio ccm M => control ( table wlm event control in monitor) \ 
dio2 (cont) => autostart 


DB20000I The SoL command completed successfully. 
db2 => commit 
DB20000I The SQL command completed successfully. 


(3) BJE pfi ST Ms oda o 


db2 => create event monitor wlm thresholds for threshold violations \ 


db2 (cont.) => write to table \ 

lo2 (Ccont.) => thresholdyiolartions (table wim thresh violations in monitor), N 
do2 (EOnt,.) => control ( table wlm thresh control in monitor ) \ 

do? comb => autostart 


DB20000I The SQL command completed successfully. 
db2 => commit 
DB200001I The SQL command completed successfully.; 


(35 创建 上 述 事 件 监视 器 后 ， 可 以 手动 局 动 或 俘 止 它们 。 如 末 在 定义 中 包含 了 
AUTOSTART 选项 ， 当 相应 的 数据 库 分 区 被 重新 激活 时 ， 访 事件 监视 融会 被 目 动 月 动 。 司 动 和 
停止 事件 监视 器 的 命令 如 下 所 示 。 

JH 5) M8 TL 


SET EVENT MONITOR monitor name STATE 1p 
Pr yl HE 
停止 监视 : 


SET EVENT MONITOR monitor name STATE 0; 


(4) 激活 WLM， 让 它 开 始 工作 。 在 事件 监视 器 被 创建 后 ， 它 们 并 不 能 收集 信息 ， 需 要 使 
用 下 和 面 的 语句 局 动 事件 监控 ， 让 它们 开始 收集 信息 。 

O 对 于 统计 事件 监控 ， 使 用 下 和 面 的 命令 启动。 在 这 个 例子 中 ， 统 计 信 息 基 于 默认 的 服务 
类 SYSDEFAULTSUBCLASS. 
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db2 => alter service class sysdefaultsubclass under sysdefaultuserclass ^ 
db2 (cont.) => collect aggregate activity data extended 

DB20000I The SQL command completed successfully. 

db2 => commit 

DB20000I The SQL command completed successfully. 


D 对 于 活动 事件 监控 ， 可 以 运行 下 述 命令 ， 创 建 如 下 的 国 值 ， 监 控 所 有 运行 超过 5 分 钟 
WHEW. 


db2 => create threshold monitorevent \ 

dio2 (cont. => for database activities N 

db2 (cont.) => enforcement database ^ 

db2 (cont.) => when activitytotaltime > 5 minutes ^ 

di2 (cont.) => collect activity dara wich details and values \ 
Gio comb => CONTINUES 


DB20000I The SQL command completed successfully. 


(3) oM TEX. HAME- 2SDPIBIBTEZJBIE. AMENE. ip P: 


db2 => create threshold activecost \ 

dio2 (cont.) => for dartabase actiyiries \ 

db2 (cont.) => enforcement database "^ 

db2 (cont.) => when estimatedsqlcost > 100000 ^ 

db2 (cont.) => collect activity data on all database partitions with details \ 
do2 (Ccont.) => CONCIiNUG 


DB20000I The SQL command completed successfully. 


DB2 WLM 捕获 的 信息 保存 在 WLM EVENT 和 WLM EVENT STMT 表 中 ， 通 过 分 析 这 
两 个 表 中 的 数据 ，DBA 可 以 发 现 系 统 中 潜在 的 问题 。 

总 的 来 说 ，DB2 工作 负责 管理 是 一 个 强大 并 且 易 于 使 用 的 工具 ，DBA 无 须 更 改 应 用 程序 
代码 ， 就 可 以 通过 和 它 控 制 复杂 的 工作 负载 ， 从 而 使 多 个 应 用 在 DB2 数据 库 环境 中 和 谐 共 处 。 


10.6 ” 效 据 仓库 优化 总 结 


在 DB2 数据 仓库 的 运 维 中 经 常会 过 到 性 能 问题 , 这 些 性 能 问题 与 OLTP 环境 相 比 有 什么 区 
3? 如 何 设 定 优 化 目标 ? 如 何 调 优 ? 这 一 市 ， 我 们 看 重 讲 述 上 述 问 题 。 


10.6.1 与 OLTP 系统 的 区 别 


DB2 数据 仓库 与 OLTP 系统 的 性 能 调 优 不 一 样 ， 主 要 表现 在 以 下 儿 个 方面 : 

(1) 事务 长 短 。OLTP 环境 中 的 事务 通 名 是 短 事务 ， 包 含 多 条 SQL 语句 ， 这 些 语句 常常 
可 以 在 数秒 内 完成 : 数据 仓库 环境 中 ， 往 往 是 长 事务 ， 只 执行 少数 几 条 SQL 语句 ， 但 是 却 需要 
运行 儿 分 钟 ， 甚 至 几 小 时 。 

(2) 数据 更 新 时 间 不 同 。 在 OLTP 环境 中 ， 数 据 更 新 操作 随时 都 在 发 生 ;， 对 于 数据 仓库 
系统 ， 数 据 通 和 津 在 特定 时 间 窗 口 ( 例 如 夜间 〉 进 行 更 新 ， 往 往 需 要 执行 大 量 提取 、 转 换 和 装载 
(ETL) 操 作 。 
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(3) 结果 集 大 小 不 同 。OLTP 环境 中 的 查询 语句 通常 只 获取 少量 数据 行 ， 数 据 仓 库 查 询 ， 
尤其 是 那些 用 来 生成 报表 或 进行 多 维 分 析 的 查询 可 能 返回 上 百 万 行 数据 。 

(4) firi i Z8 EA IH], OLTP 环境 中 的 查询 语句 比较 简单 ,通常 只 访问 少数 几 个 表 ; 但 是 ， 
数据 库 仓库 环境 中 的 查询 语句 比较 复杂 ， 可 能 包含 十 儿 个 甚至 更 多 表 的 关联 ， 包 含 舱 套 的 或 通 
用 的 表达 式 、 递 归 SQL. CASE 表达 式 等 。 

(5) SQL 语句 的 生成 方式 不 同 。OLTP B3, 38 $e H8; SQL 语句 ; 在 数据 仓库 环 
境 中 ， 常 常 由 OLAP 工具 生成 SQL 语句 ， 在 执行 之 前 很 少 有 机 会 修改 它 ，DBA 负责 设置 适当 
的 DB2 运行 环境 ， 让 这 些 查询 能 够 高 效 运 行 。 

10.6.2” 设 定 优化 目标 

在 进行 调 优 时 , 不 但 要 追求 良好 的 性 能 , 还 要 确保 方 回 正确 。 如 果 一 个 查询 运行 时 间 很 长 ， 
但 是 用 户 觉 得 可 以 接受 ， 那 么 这 个 僵 询 也 不 一 定 需 要 优化 : 相反 ， 一 个 频繁 执行 的 查询 ， 由 于 
用 户 期 望 它 能 在 1 秒 内 完成 ， 那 么 即使 它 的 运行 时 间 只 有 5 秒 ， 也 会 引起 用 户 的 抱怨 。 

对 于 判断 什么 地 方 需 要 调 优 ， 最 好 听 上 听 用 户 的 声音 ， 优 先 解 决 用 户 最 关注 的 得 询 语 句 ; 如 
果 用 户 没 什么 抱 仿 ， 那 么 可 以 花 时 间 调 整 那些 运行 时 间 长 和 执行 频率 高 的 查询 语句 。 

有 关 如 何 优化 得 询 语 名， 请 读者 阅读 本 书 第 9 革 的 相关 内 容 。 

10.6.3 物理 优化 


物理 优先 从 CPU、 存储 和 内 存 三 方面 加 以 调整 。 
1. 利用 多 核 CPU 并 行 性 


从 10.2.1 节 了 解 到 ，DB2 通常 运行 在 SMP 服务 器 和 MPP 服务 器 集群 环境 ， 针 对 这 两 种 环 
境 ， 要 发 挥 多 核 CPU 的 并 行 能 力 来 提升 查询 性 能 。 

在 SMP 服务 器 环境 上 , 一 条 CPU 通常 都 有 多 个 内 核 ， DB2 可 以 把 处 理 查 询 所 需 的 工作 分 
制 为 片段 ， 并 行 地 执行 这 些 片 段 ， 这 会 显著 减少 查询 时 间 。 通 过 把 数据 库 管 理 程序 参数 
intra parallel 的 值 设 置 为 YES， 就 可 以 司 用 SMP HR At 28 HJ 193011 TE 

除了 能 够 在 SMP 服务 器 中 并 行 查询 之 外 ，DB2 还 可 以 通过 MPP 服务 器 集群 来 提升 查询 
性 能 ， 恋 者 可 以 按照 10.3 节 有 关内 容 做 好 MPP 环境 下 的 配置 工作 。 

2. 做 好 存储 规划 


关于 存储 的 设计 , 原则 是 保证 每 一 个 数据 BPU 都 有 属于 目 己 的 一 组 物理 磁盘 ,， 并且 保证 数 
据 仓 库 中 的 所 有 数据 对 象 都 均 久 地 分 布 在 这 些 磁盘 上 。 这 种 设计 模式 ， 可 以 保证 每 个 BPU 中 的 
所 有 数据 对 象 ， 都 会 平衡 地 进行 UO 操作 。 

为 了 避免 数据 和 日 志 读 写 冲 突 ， 数 据 和 日 志 应 该 放 在 不 同 的 磁 检 上。 此 外 ， 把 主 日 志文 件 
和 镜像 日 筷 文件 存放 在 不 同 的 磁盘 上 ， 这 样 当 东 个 磁盘 出 现 故 障 时 还 有 夯 外 一 份 日 筷 文件 可 以 
使 用 。 

3. 合理 配置 缓冲 池 


对 于 IO 密集 型 的 数据 仓库 工作 负载 而 言 ， 绥 剖 池 越 大 ， 人 性 能 通 冲 束 越 好 ， 这 是 由 于 随 春 
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绥 冲 池 大 小 的 增加 ， 磁 盘 UO 活动 的 数量 会 减少 。 

但 是 对 32 位 系统 而 言 ， 内 存 大 小 限制 为 4GB， 为 了 能 够 使 用 更 多 的 内 存 ， 建 议 优先 使 用 
64 位 系统 。 如果 64 位 的 服务 器 有 大 量 内 存 资源 , 就 应 该 多 分 配 内 存 资源 供 DB2 数据 仓库 使 用 。 
我 曾经 见 过 在 32GB 系统 内 存 的 服务 器 上 ， 只 给 DB2 配置 了 800MB Writ, XADI, W 
置 16~20GB 比较 合适 。 


10.6.4 ”逻辑 优化 


逻辑 上 ， 要 合理 利用 DB2 提供 的 分 区 、 索 引 、MDC、MQT 等 拉 术 来 提升 性 能 ， 具 体 的 优 
化 建议 如 下 。 

(1) 对 大 表 进 行 分 区 

优先 对 大 表 进 行进 行 分 区 ， 分 区 时 为 表 选 择 合适 的 分 区 键 ， 可 以 是 单一 列 ， 也 可 以 包含 多 
列 。 表 分 区 的 详细 介绍 请 参考 本 书 5.3 节 。 

(2) 维护 数据 库 编 目 统计 信息 

数据 库 编 目 统计 信息 直接 影响 DB2 优化 器 对 访问 路 径 决 策 的 选择 ， 只 有 为 优化 器 提供 全 
面 、 准 确 的 统计 信息 ， 它 才能 做 出 合理 的 访问 路 径 决 策 。 我 们 可 以 通过 定期 运行 RUNSTATS 
命令 ， 收 集 最 新 的 统计 信息 。 

(3) 利用 索引 

对 于 OLTP 环境 ， 索 引 会 使 得 Insert、Update 和 Delete 操作 变 慢 ， 所 以 在 创建 索引 方面 往 
往 采 取保 守 的 策略 ， 建 议 索 引 的 个 数 为 3~5 个 。 然 而 ， 在 数据 仓库 中 绝 大 多 数 操 作 是 查询 ， 所 
以 创建 更 多 索引 是 有 意义 的 ， 通 常 建议 5-10 个 。 但 是 ， 也 不 要 为 数据 仓库 中 的 表 创 建 过 多 索 
引 ， 和 否则 会 影响 ETL 性 能 。 

(40 利用 MDC 特性 

数据 仓库 环境 中 ， 常 常会 大 批 地 获取 行 ， 例 如 获取 某 客户 在 过 去 5 年 在 某 区 域 所 有 的 销售 
记录 。 这 种 情况 就 可 以 使 用 DB2 提供 的 多 维 聚 徐 MDC 特性 ， 从 而 可 以 大 批量 地 获取 具有 相同 
维度 值 的 记录 。 关 于 MDC 的 详细 介绍 ， 请 参考 本 书 5.4 市 。 

(5) 通过 MQT 提升 性 能 

MQT 是 通过 查询 语句 定义 的 一 个 结果 集 ， 在 本 书 5.5 节 对 其 有 详细 介绍 ， 它 适合 优化 复杂 
报表 或 者 分 析 应 用 ， 它 有 三 个 优点 : 

e DB2 可 以 自动 地 重 写 查询 以 使 用 MQT。 

e MQT 中 的 结果 集 已 经 建立 了 ， 这 样 在 执行 但 询 时 可 以 从 MQT 中 和 直接 获取 而 不 需要 再 

动态 地 构建 这 个 结果 集 ， 这 样 会 显著 减少 执行 时 间 。 
e 可 以 在 MQT 上 创建 和 索引， 这 会 进一步 提高 查询 性 能 。 


10.7 5 Oracle 数据 仓库 比较 


Oracle 在 面 问 数据 仓库 的 解决 方案 中 采用 的 是 RAC 架构 ， 它 的 全 称 是 Real Application 
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Clusters， 邵 “真正 应 用 集群 ”。 下 和 面 从 儿 个 角度 来 看 看 RAC 的 特点 。 

从 逻辑 结构 上 看 ， 与 DB2 的 “Share-Nothing” 不 同 的 是 ，RAC 采用 的 是 “Share-Disk” 技 
术 ， 集 群 中 每 个 和 点 上 的 实例 〈Instance) 都 访问 同一 个 数据 库 。 这 样 的 结构 在 扩展 性 方面 会 有 
很 多 问题 ， 例 如 随 独 节点 的 增多 ， 节 点 间 的 通信 、 协 调 的 复杂 程度 歼 呈 几何 级 数 上 升 ， 管 理 难 
EERTE 

从 易 用 性 的 角度 看 ，RAC IR] RIER; 另外 ，RAC 的 实施 比较 复杂 ， 涉 及 网 络 、 
存储 设备 、 操 作 系 统 、 集 群 软件 、 数 据 库 产品 等 ,一旦 出 了 问题 ， 定 位 问题 非常 困难 。 

从 稳定 性 的 角度 看 ，RAC 的 稳定 性 也 有 很 大 的 问题 。 例 如 在 双 市 点 的 RAC 环境 中 ，Oracle 
的 DBA 有 时 候 会 发 现 两 个 节点 中 一 个 正音 运行 、 而 另 一 个 被 锁 死 的 情况 ;也 会 出 现 因 RAC 上 
线 导 致 数据 库 系统 的 性 能 急剧 下 降 ， 甚 至 RAC 由 双 机 运行 变 成 单机 运行 ， 双 机 完全 成 为 摆设 
的 情况 也 屡见不鲜 。 

从 扩展 性 的 角度 看 ，RAC 可 以 增加 和 点 提升 集群 的 处 理 能 力 。 但 是 所 有 的 节点 〈 包 括 新 增 
节点 ) 访问 同一 个 共 孚 磁盘 集群 ， 这 意味 着 所 有 的 得 询 都 要 访问 相同 的 底层 存储 设备 ， 从 而 会 
受到 IO HEE HY RR I 

下 面 ， 我 们 给 出 DB2 数据 仓库 与 Oracle 数据 仓库 的 对 比 总 结 ， 如 表 10-3 所 示 : 


表 10-3 DB2 5 Oracle 数据 仓库 技术 对 比 总 结 


比较 内 容 Oracle 
采用 的 架构 名 称 DPF RAC 
数据 库 层 的 SMP 集群 + 共享 磁 
架构 特性 真正 的 MPP 
RHI MPP 存储 层 


安装 、 维 护 简单 ， 无 须 调整 应 


易 用 性 安装 、 配 置 复杂 ， 维护 难度 大 ， 


bh 
GIN 
Gi 
HE 
| 


扩展 性 极 易 扩 展 ， 不 存在 瓶颈 扩展 性 无 法 突破 VO 瓶颈 

为 OLTP 系统 设计 的 架构 ， 不 
总 结 专 为 数据 仓库 设计 的 架构 DN 

适合 数据 仓库 


10.8 h2 


在 本 章 开篇 对 数据 仓库 的 基本 概念 作 了 简单 阐述 ， 对 于 没有 数据 仓库 经 验 的 读者 可 以 从 党 
握 这 些 基本 概念 入 手 ， 为 透彻 地 理解 本 章 后 续 内 容 作 铺 垫 。 随 后 本 章 重 点 介绍 了 DB2 数据 库 在 
支持 数据 仓库 方面 所 具有 的 特性 ， 并 详细 讲解 了 面向 数据 仓库 的 DB2 系统 设计 原则 和 经 验 。 通 
过 一 个 实战 案例 ,让 读者 掌握 如 何 搭建 DB2 数据 仓库 。 本 章 最 后 对 数据 仓库 的 性 能 优化 进行 了 
讲解 ， 相 信 可 以 帮助 读者 解决 日 常 运 维 中 过 到 的 性 能 问题 。 
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同样 都 是 DB2 for z/OS 的 追随 者 ，DB2 pureScale 和 Oracle RAC 之 间 有 什么 区 别 ? 

DB2 pureScale 在 国内 有 没有 真实 的 使 用 案例 ”如 果 有 的 十 是 如 何 规划 和 实施 的 ? 它 的 性 
能 和 用 户 体 验 如 何 ? 

与 单 节点 的 DB2 相 比 , DB2 pureScale 在 运 维 上 有 什么 需要 DBA 特别 注意 的 ? DB2 DPF 
给 用 户 的 感 竞 也 是 多 合 服务 怖 的 “集群 ”，pureScale 与 之 相 比 有 什么 不 同 ? 


本 章 将 会 给 出 这 些 问题 的 答案 。 


j | 1 1 


什么 是 DB2 pureScale? 


第 11 DB2pureScale ££ 7444 4$ & — 马 


11.1 深入浅出 DB2 pureScale 架构 


DB2 数据 库 提供 了 慌 直 (Scale Up). 和 水 平 〈Scale Out) 两 种 扩展 方式 。 如 图 11-1 所 示 ， 
垂直 扩展 方式 中 ， 通 过 在 单个 服务 器 内 增加 CPU、 内 存 以 及 存储 来 提升 处 理 能 力 ; 在 水 平 扩展 
方式 中 ， 通 过 增加 服务 器 节点 来 提升 处 理 能 力 ，DB2 数据 仓库 (DPF) 和 DB2 pureScale Wij 
水 平 扩展 方式 的 两 种 典型 。DB2 数据 仓库 在 第 10 章 已 经 讲述 过 了 ， 本 章 重 点 讲述 DB2 


pureScale。 


(3E HD Scale Up (水 平 ) Scale out 


4 
CPUS 


单个 服务 器 增加 向 集群 增加 
CPU. AIRE Rs 8T SURHR E 


图 11-1 DB2 数据 库 两 种 扩展 方式 


DB2 pureScale 是 在 2009 年 12 月 发 布 的 DB2 V9.8 这 个 版 本 中 首次 提出 的 , 它 采 用 了 z/OS 
大 型 机 上 成 熟 的 共享 磁盘 (Share Disk) 技术 ， 具 有 非常 强 的 可 靠 性 和 稳定 性 。 下 面 从 架构 、 特 
点 以 及 和 DB2 DPF 的 区 别 这 三 个 方面 分 别 讲述 。 


11.1.1 DB2 pureScale 架构 


如 图 11-2 所 示 ， 从 架构 上 看 ，DB2 pureScacle 分 为 三 层 , 即 数 据 库 集群 、 集 群 服务 和 GPFS 
文件 系统 。 

第 一 层 ， 数 据 库 集 群 ， 由 成 员 和 Coupling Facility 节点 《简称 为 CF) 组 成 。 成 员 代 表 一 个 
DB2 处 理 引 擎 ， 在 系统 负载 变化 时 可 以 动态 添 加 或 删除 成 员 ， 数 据 库 集 群 活跃 成 员 数量 的 变化 

`\ 影 响 客户 端的 应 用 。CF 区 点 采用 集中 锁 机 制 以 保证 数据 的 一 致 性 ， 另 外 ，CF Bt HORT 
理 DB2 数据 页 的 全 局 缓存 。 在 实际 应 用 中 ， 为 了 实现 高 可 用 性 ， 应 配置 两 个 CF Bm. SE 
从 ， 这 样 可 以 避免 单 点 故障 。 

第 二 层 ， 集 群 服务 。 包 括 IBM Tivoli Systems Automation for Multiplatforms (TSAMP) ) 和 
Reliable Scalable Cluster Technology (RSCT ) 。TSAMP 技术 是 用 来 实现 高 可 用 性 的 。 那么 RSCT 
技术 是 用 来 做 什么 呢 ? 众所周知 ， 集 群 中 各 个 节点 通过 心跳 机 制 来 通报 彼此 的 情况 ， 例 如 ， 集 
群 中 只 有 2 个 节点 , 某 一 时 刻 厄 点 1 的 心跳 出 现 故 障 , 但 是 市 点 1 还 在 运行 , 市 点 2 也 在 运行 ， 
但 是 接收 不 到 市 点 1 的 心跳 了 ， 于 是 集群 就 分 裂 为 两 个 小 的 集群 了 ， 这 种 场景 被 称 为 脑 裂 

(Split-Brain) 。 那 么 出 现 了 这 种 情况 ， 哪 个 节点 来 接管 整个 集群 吗 ? 通常 需要 借助 仲裁 盘 
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(Tiebreaker disk) 或 者 仲裁 IP， 即 由 仲裁 者 来 决定 由 哪个 节点 来 接管 。 上 述 脑 裂 处 理 的 细 廊 都 
通过 RSCT 技术 被 自动 整合 到 DB2 pureScale 中 了 。 
第 三 层 , GPFS 文件 系统 .DB2 pureScale 各 个 节点 通过 GPFS 文件 系统 访问 共享 存储 。GPFS 


它 保证 在 资源 组 内 的 所 有 节点 可 以 并 行 访问 整个 文件 系统 ;而且 
关于 存储 ， 


是 一 个 并 行 的 磁盘 文件 系统 ， 
针对 此 文件 系统 的 服务 操作 , 可 以 同时 安全 地 在 使 用 此 文件 系统 的 多 个 节点 上 实现 。 


强烈 推荐 使 用 文 持 “SCSI-3 永久 保留 ”(Persistent Reservations) 的 存储 设备 ， 尺 管 DB2 pureScale 
也 可 以 支持 非 SCSI-3 协议 的 存储 ， 但 是 发 生 故 障 时 ， 故 障 市 点 对 支持 SCSI-3 协议 的 存储 进行 
隔离 所 需要 的 时 间 要 远 小 于 非 SCSI-3 协议 的 存储 。 为 了 方便 用 户 ，DB2 RIETER S GPFS 


文件 系统 的 安装 和 配置 。 
客户 机 DB? 服务 器 


图 11-2 DB2 pureScale 架构 


11.1.2 DB2 pureScale 的 特点 


下 面 ， 我 们 深入 讲解 一 下 DB2 pureScale 的 特点 。 

1. 极 好 的 扩展 性 

从 上 节 了 解 到 ，DB2 pureScale 使 用 CF 节点 对 锁 进 行 集中 式 管理 ， 从 而 大 大 减少 了 由 于 不 
同 成 员 之 间 进 行 额 外 的 锁 交 换 请 求 所 帝 来 的 开销 ， 这 使 得 随 需 增加 和 删除 成 员 成 为 可 能 ， 从 而 
实现 了 极 好 的 扩展 性 。 如 图 11-3 所 示 ， 在 集群 规模 达到 112 个 成 员 的 情况 下 ， 扩 展 性 仍然 可 以 


达到 81% 以 上 。 


结果 
112 个 成 员 扩 展 | 


性 达到 81% 以 上 | 


88 个 成 员 扩 展 


tiges 
84 Fk 
| 展 性 达到 64 个 成 员 扩 展 
95% 以 上 | 性 达到 91% 以 
: / f 32 个 成 员 扩 


m 展 性 达到 | 
| 95% 以 上 

| | 16 个 成 员 扩 —3 E 
ERAN | 


以 上 


ad 
panse 
图 11-3 DB2 pureScale 恨 好 的 扩展 性 
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2. 应 用 透明 性 

对 运行 在 DB2 pureScale 环境 中 的 应 用 来 说， 并 不 需要 知道 连接 到 哪 一 个 成 员 ， 根 据 负 载 
均衡 机 制 ， 应 用 的 事务 会 被 目 动 转发 给 最 合适 的 成 员 。DB2 pureScale 也 实现 了 原来 DB2 所 使 
用 语法 的 原生 文 持 ， 这 使 得 这 些 应 用 可 以 不 做 修改 或 仅 做 细小 修改 球 能 运行 在 DB2 pureScale 
环境 中 。 

3. 持续 可 用 性 


DB2 pureScale 实现 了 活跃 -活跃 式 配 置 ， 如 果 一 个 成 员 发 生 宕 机 时 ， 这 时 该 宕 机 成 员 中 修 
改 的 数据 会 暂时 失效 ， 等 其 恢复 后 数据 即 可 用 ， 这 个 时 间 很 短 。 在 此 期 间 ， 其 余 事 务 会 在 其 他 
活跃 的 成 员 继续 进行 。 


11.1.3 DB2 pureScale 5 DB2 DPF 的 区 别 


在 第 10 章 讲 过 DB2 DPF 技术 以 及 在 数据 仓库 中 的 应 用 ， 那 么 DB2 pureScale 和 DB2 DPF 
有 什么 异同 呢 ? 

首先 ， 谈 谈 相 似 点 。 二 者 都 是 由 多 人 台 机 需 组 成 的 数据 库 集 群 ，DB2 pureScale 由 成 员 和 CF 
几 点 组 成 ，DB2 DPF 由 数据 节点 和 协调 节点 组 成 ; 另外 ， 二 者 都 有 很 好 的 扩展 能 力 ， 通 过 增加 
太 点 资源 即 可 线性 扩展 布点 ;最 后 ， 二 者 都 文 持 目 动 客 户 端 路 由 功能 。 

下 面 着 重 讲述 他 们 之 间 的 不 同 点 。 

(1) 二 者 的 架构 是 完全 不 同 的 。DB2 DPF 采用 非 共 享 (Share Nothing) 体系 结构 ， 数 据 
库 在 一 个 非 共 享 的 环境 中 被 分 解 为 独立 的 分 区 ， 每 个 分 区 都 具有 自己 的 资源 , 例如 内 存 、CPU、 
磁盘 以 及 自己 的 数据 索引 配置 文件 和 事务 日 志 。 节 点 具有 独立 处 理 单一 任务 的 能 力 ， 可 以 独立 
处 理 一 部 分 数据 ， 分 区 间 数 据 通过 普通 网 络 即 可 进行 交互 。 从 上 和 节 了 解 到 ，DB2 pureScale 采用 
I xe deo du ARTI. 成 员 和 CF nu EA ECBZVI IH] DUI RRRA, 成 员 和 CF 之 间 必 须 通过 高 速 网 络 
HHT As 

(2) 二 者 的 用 途 是 完全 不 同 的 。DB2 DPF 技术 主要 用 于 文 持 OLAP 应 用 ， 特 别 是 在 大 型 
数据 仓库 方面 得 到 了 非常 广泛 的 应 用 ; DB2 pureScale 技术 是 为 OLTP 应 用 而 量 身 定做 的 ,侧重 
于 高 并 发 的 事务 型 应 用 。 

(3) 二 者 运行 场景 下 的 数据 量 是 不 同 的 。DB2 DPF 由 于 用 在 数据 仓库 方面 ， 所 以 数据 量 
通 弟 都 很 大 ;基于 DB2 pureScale 的 应 用 通常 数据 量 没 有 DB2 DPF 应 用 的 场合 那么 大 。 


11.2. MEAE: 5 Oracle RAC 对 比 


通过 上 面 的 学 习 , 相信 读者 已 经 了 解 了 DB2 pureScale 的 架构 以 及 特点 ， 那 么 与 Oracle RAC 
相 比 ，DB2 pureScale 有 什么 优势 呢 ? 毕竟 Oracle RAC 也 是 基于 共享 磁盘 技术 的 ， 而 且 取 得 了 
极为 广泛 的 应 用 ， 作 为 后 来 者 的 DB2 pureScale X EB- Oracle RAC 相似 ， 但 是 具体 技术 实 
MATENA EKK J 
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1. 集群 结构 


DB2 pureScale 采用 CF T AEREAS HEMER If] Oracle RAC 采用 分 布 式 
锁 管 理 和 分 布 式 缓存 。 在 RAC 中 ， 随 看 集群 入 点 的 增多 ， 由 分 布 式 架构 市 来 的 多 市 点 间 的 通 
讯 协 调 复杂 度 将 呈 指 数 级 增长 ， 僚 接 凶 调用 、 中 断 和 CPU 上 下 文 切 换 会 大 大 降低 处 理 效 率 。 在 
DB2 puresSale 中 ， 所 有 成 员 节 点 都 和 CF 节点 单一 通讯 以 获取 数据 和 全 局 锁 。 由 于 采用 全 局 管 
理 锁 和 缓存 ，DB2 pureScale 系统 结构 大 大 简化 了 ， 即 使 扩展 到 128 贡 点 ， 还 能 保持 比较 好 的 线 
性 扩展 能 


方 点 故障 恢复 


当 出 现成 员 故 障 的 时 候 ， 与 Oracle RAC 相 比 ，DB2 pureScale 的 故障 恢复 时 间 非 常 短 。 

首先 来 看 成 员 ( 或 实例 ) 故障 时 , Oracle RAC 集群 的 恢复 时 间 , 如 图 11-4 所 示 , Oracle RAC 
集群 中 实例 1 出 现 故障 ， 实 例 2 将 作为 恢复 实例 读 取 实例 1 的 日 志 并 锁定 需要 恢复 的 页 面 ， 这 
时 所 有 的 VO 请 求 将 会 被 冻结 ， 和 直到 完成 对 实例 1 的 恢复 后 ， 集 群 的 IO 请 求 才 会 被 解冻 从 而 
整个 集群 恢复 正常 。 


Tus 恢复 实例 读 取 故障 节点 
ZA PE li 的 H 志 


在 冻结 解除 之 前 必须 
污 取 日 去 并 锁定 页 面 


iL LI 


恢 和 但 实例 锁定 需要 恢复 的 页 面 
图 11-4 Oracle RAC 成 员 故 障 导 致 /0O 冻结 


如 图 11-5 所 示 ，DB2 PureScale 集群 中 的 成 员 1 出 现 故 障 ， 成 员 2 将 负责 恢复 工作 ， 成 员 
2 将 从 CF 中 读 取 成 员 1 二 要 恢复 的 负面， 不 会 造成 UO 冻结 ， 集 群 很 快 束 能 恢复 运行 。 


CF SG HOT EEE ER 
正在 处 理 中 
E a B HT u 
在 出 现 故障 时 , CF 知道 这 些 页 面 的 哪些 行 正 在 更 新 过 程 中 
图 11-5 DB2 pureScale 成 员 故 障 无 IO 冻结 
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3. 市 点 之 间 通 讯 机 制 


除了 节点 之 间 通 过 心跳 测试 来 检测 相互 状态 外 ， 成 员 与 CF 之 间 通 过 InfiniBand 网 络 连 接 ， 
并 使 用 RDMA (Remote Direct Memory Access) 内 存 复 制 直 接 交 换 数 据 ， 避 人 免 高 成 本 的 进程 间 
通讯 。 尽 管 InfiniBand 网 络 也 可 应 用 于 Oracle RAC 集群 ， 但 是 Oracle RAC 成 员 之 间 使 用 速 
度 较 慢 的 套 接 字 协议 进行 通信 ， 并 且 需 要 一 些 开 销 较 大 的 CPU 中 断 ， 从 而 影响 集群 性 能 。 


11.3. 菏 银 行 DB2 pureScale 实战 案例 


上 和 而 介绍 了 DB2 pureScale 的 架构 , 为 了 让 读者 更 深入 理解 DB2 pureScale 在 实际 生产 环境 
中 的 规划 和 实施 ， 接 下 来 分 圣 一 个 某 银行 的 真实 案例 。 

该 银行 是 中 国 最 大 的 商业 银行 ， 总 部 位 于 华东 ， 网 点 超过 800 家 、 员 工 近 6 万 人 的 全 国 性 
股份 制 商 业 银 行 ， 并 跻 吴 全 球 前 100 家 大 银行 之 列 。 

该 行 的 信用 卡 系统 每 秒 钟 要 服务 的 用 户 量 超 过 了 10000 人 ， 每 秒 钟 会 有 5000 5TH 23 A22, 
要 求 24X7 小 时 运行 ， 每 年 允许 出 现 故障 的 时 间 是 5 分 钟 ， 目 前 数据 量 已 经 达到 了 10T 左右 ， 
随 看 数据 量 和 用 户 量 的 增加 ， 整 个 系统 的 节点 要 容易 扩展 。 

这 对 信用 卡 系统 的 数据 库 文 撑 能 力 提 出 了 技术 挑战 ， 因 为 原来 的 基于 IBM AS 400 平台 的 
数据 库 系统 难以 满足 事务 高 吞吐 量 、 持 续 可 用 性 和 扩展 能 力 的 需要 。 

最 后 ， 经 过 一 系列 的 技术 验证 ， 该 银行 最 终 选 择 了 DB2 pureScale。 


11.3.1 ”从 硬件 配置 开始 


经 过 多 次 讨论 ， 最 终 确 定 了 硬件 配置 方案 。 主 机 选用 2 台 IBM Power 740, 存储 选择 IBM 
DS 5300， 其 原因 在 于 DS 5300 支持 SCSI-3 持久 保护 (Persistent Reserve) ， 这 样 当 发 生 故 障 
时 ， 可 以 实现 快速 的 IO 隔离 (IO Fencing) 。 单 台 Power 740 的 配置 见 表 11-1. 


表 11-1 单 台 Power 740 主要 配置 信息 


m 注释 
处 理 器 
内 存 
HCA E LIB 网卡) 本 实例 中 ， 一 块 用 作 IB 网 卡 ， 另 一 块 用 于 连接 扩展 相 
双 端 口 以 太 网 卡 用 于 连接 外 部 网 络 
光纤 阵列 卡 用 于 连接 SAN 存储 交换 机 
^R d 总 容量 为 300GB 


根据 项 目 需 要 , 本 案例 规划 了 2 个 成 员 节 点 和 2 个 CF 节点 , 分 区 规划 方案 如 表 11-2 所 示 ， 
每 台 Power 740 划分 成 两 个 AIX 分 区 (PAR) ， 其 中 一 个 分 区 用 来 运行 成 员 节 点 ， 另 外 一 个 
分 区 用 来 运行 CF 节点 。 
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表 11-2 DB2 pureScale 集群 服务 器 资源 规划 表 


物理 机 器 编号 
P740-01 10 核 40 G 2 块 共 
P740-01 24 G 2 块 

P740-02 Member 1 10 核 40 G it 
740-02 


11.3.2 ”突破 难点 : 网 络 规划 


HCA + 


如 图 11-6 Przs, DB2 pureScale 集群 使 用 三 种 网 络 ， 分 别 是 以 太 网 络 、InfiniBand 网 络 和 
SAN 存储 网 络 。 其 中 以 太 网 络 是 外 部 网 络 ， 供 应 用 访问 数据 库 集 群 使 用 ，InfiniBand 网 络 是 内 
部 网 络 , 供 集 群 节点 互联 使 用 , 之 所 以 选用 InfiniBand 网 络 是 由 于 其 网 速 非常 高 , 可 以 达到 40G 


bit/s， 以 确保 成 员 和 CF T L E RRE AE., SAN 存储 网 络 供 集群 节点 访问 共 孚 存储 使 用 。 


本 案例 中 ， 为 了 避免 单 点 故障 ， 将 采用 两 合 InfiniBand 交换 机 。 


QLogic IB 交换 机 -1 QLogic IB 交换 机 -2 


InfiniBand 网 络 


以 太 网 交换 


P740-1 


SAN 存储 网 络 | 


| UE DS5300 


图 11-6 DB2 pureScale 网 络 拓扑 结构 


本 市 将 深入 探讨 以 太 网 规划 和 InfiniBand 网 络 规划 ， 并 重点 解答 配置 中 常见 的 问题 。 


1. 以 太 网 规划 和 配置 


本 环境 中 共有 2 R Power 740， 每 台 Power 740 有 4 块 网 卡 ， 而 每 台 Power 740 被 划 分 为 两 
个 AIX 分 区 ， 每 个 分 区 上 都 分 配 有 2 块 以 太 网 卡 ， 而 每 个 以 太 网 卡 是 双 端 口 的 ， 所 以 每 个 分 区 


一 共有 4 个 以 太 网 接口 可 供 使 用 ， 可 以 使 用 lsdev PEER: 


-lasn=3.2 L868Y -Ce adapter |grep =i "ent" 

ent0 aA 10/100/1000 Base=TX on nlls 
ent1 Available 04-01 4-Bort 10/100/1000 Bs scc Ie mones 
ent2 available 05-00 4=Port 10/100/1000 Base=TX nis 
ento Available OA 10/100/1000 Ease PCI=ExXOrTeEesSE 


ARMEEN HE, 本 案例 采用 3H 的 方式 将 每 个 分 区 上 的 ent0, entl, 


Adapter 
Adapter 
Adapter 
Adapter 


(14106803) 
(14106803) 
(14106803) 
(14106803) 


ent2 和 ent3 


做 EtherChannel 绑 定 ， 其 中 ent0、entl 和 ent2 三 个 网 口 配 置 成 负载 均衡 ， 而 使 用 ent3 做 为 它们 
还 能 够 消除 以 太 网 卡 和 以 太 网 交换 机 出 现 的 单 点 故障 。 


的 备份 网 口 。 这 样 不 仅 能 提升 吞吐 量 ， 
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在 AIX 操作 系统 下 ， 可 以 使 用 “smitty” 交 互 式 界面 来 完成 网 卡 配 置 。 在 命令 行 提 示 符 下 
键入 “smitty etherchannel” 进 入 交互 式 界 面 ， 选 择 ent0、entl 和 ent2 三 个 网 口 绑 定 在 一 起 ， 选 
择 ent3 作为 它们 的 “Backup Adapter”， 注 意 ，ent0、entl 和 ent2 必须 与 同一 台 交 换 机 连接 ， 
ent3 连接 到 另外 一 侣 交换 机 上 。 

在 AIX 系统 中 做 完 EtherChannel 绑 定 之 后 ， 束 能 看 到 系统 中 狐 增 加 了 一 个 虚拟 网 口 ent4， 
这 个 ent4 束 是 把 ent0、entl 和 ent2 绑 定 后 系统 狐 加 的 一 个 混合 端口 ， 如 下 所 示 : 


-bash-3.24 lsdev -Ce adapter |grep =i 'ent' 

ent0 Available 04-00 4-Port 10/100/1000 Base-TX PCI-Express Adapter (14106803) 
enti Available 04-01 4-Port 10/100/1000 Base-TX PCI-Express Adapter (14106803) 
ent2 available 05-00 4=Port 10/100/1000 Base=TX PCI=-mxpress Adapter (14106803) 
ent3 Available 05-01 2424-Bort 10/100/1000 Base=TX PCI=-mExpress Adapter (14106803) 
eth4 Available EtherChannel / IEEE 802.3ad Link Aggregation 


然后 ， 使 用 smitty inet 为 ent4 设置 IP 地 址 。 
重复 上 面 的 步骤 ， 在 其 他 所 有 的 分 区 上 完成 Etherchannel 的 配置 和 了 IP 地 址 设 定 。 
最 后 还 需要 将 IP 地 址 和 主机 名 的 对 应 关系 加 到 每 个 节点 的 /etc/hosts 文件 中 去 ， 如 下 所 示 : 


2 GR SO IN db2member0 
172.16.50.12 db2member1 
JL 22 t OE, cem Oeo d o5) Gl52GCEU 
172.16-50.16 eio EN 


2. InfiniBand 网 络 规划 和 配置 


在 这 个 案例 中 ， 使 用 了 两 台 InfiniBand 交换 机 来 为 DB2 pureScale 集群 提供 一 个 高 可 用 的 
InfiniBand 网 络 环境 。 

在 服务 器 端 , 每 台 Power 740 上 配置 有 两 块 双 端 口 的 InfiniBand 网 卡 , 也 就 是 俗称 的 IB F, 
其 中 一 块 用 来 连接 Power 740 的 扩展 柜 ， 因 此 每 台 Power 740 服务 器 上 只 能 有 一 块 IB 卡 用 于 
DB2 pureScale 集群 。 由 于 每 台 740 被 划分 成 两 个 AIX 逻辑 分 区 ， 这 两 个 逻辑 分 区 要 共有 至 这 块 
IB 卡 。 这 块 卫 网卡 上 有 两 个 端口 ， 很 多 人 可 能 认为 每 个 分 区 各 占 一 个 靖 口 。 实 际 上 不 是 这 样 ， 
IB 卡 资源 的 划分 是 按照 市 宽 来 分 配 的 。 

在 本 案例 中 ， 成 员 节 点 将 仅 使 用 这 两 个 山口 中 的 一 个 ;为 了 提升 CF TARA EEA H 
lE, CF 区 点 将 同时 使 用 这 两 个 端口 。 


人 注意 : 需要 为 1B 卡 配置 IP 地 址 
DB2 pureScale 集群 中 成 员 凶 点 和 CF 市 点 之 间 的 通信 是 通过 RDMA 协议 ， 而 不 是 
IP 网 络 。 但 是 ， 仍 然 需要 为 IB 卡 配置 了 了 地址 ， 该 IP 地 址 会 被 DB2 pureScale 集群 管理 
软件 TSA 用 于 监控 集群 内 部 状态 ， 所 以 使 用 私有 IP 地 址 即 可 。 


在 所 有 4 个 分 区 上 ， 第 一 个 端口 ib0 使 用 10.10.10.* 网 段 的 地 址 ， 而 对 CF 所 在 分 区 上 的 第 
二 个 端口 ibl 使 用 10.10.11.* 网 段 的 地 址 。 最 终 关 于 InfiniBand 网 卡 的 IP 规划 如 下 表 11-3 所 示 : 
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3 11-3 InfiniBand 网 络 的 1IP 规划 


机 器 编号 | HCA- ma | ne — IB 主机 名 IB 网 络 IP/mask 


10.10.10.1/ 
255.255.255.0 
10.10.10.2/ 
255.255.255.0 
CF 0 
10.10.11.2/ 
255.255.255.0 
u 10.10.10.3/ 
255.255.255.0 
10.10.10.4/ 
255.255.255.0 
10.10.11.4/ 
db2cfl-ib1 
255.255.255.0 
根据 上 面 的 规划 ， 接 下 来 具体 介绍 一 下 在 Power 740 上 的 安装 和 配置 步骤 。 
第 一 步 ， 安 装 uDAPL 了 驱动 。 
该 驱动 文件 可 以 从 IBM 官方 网 站 上 下 载 ， 网 址 为 https://www14.software.ibm.com/webapp/ 
iwm/web/reg/signup.do?source-aixbp&lang-en US&S PKG=udapl。 使 用 root 用 户 登 录 AIX 系统 ， 


使 用 “smitty install ”命令 进行 安装 。 安 装 完 成 之 后 用 命令 “1]slpp -1 bos.mp64 devices.chrp. 
IBM.Ihca.rte devices.common.IBM.ib.rte udapl.rte” 检 查 驱 动 是 否 正 确 安装 ， 如 下 所 示 : 


CF I 


=basşh=3.2$ lelpp =l bos- -mpb4 deyices.chrp. IBM, Llhcea. rte devices, common , TBM, 15. rte 
udapl.rte 


Fileset Level State Description 


Paths /usr/Lilb/objrepos 
bos.mpo4 6.1.7.2 COMMITTED Base Operating System d 
Multiprocessor Runtime 
deyices chto. LBM Lnca rte 6 -1-7-1 COMMITTED Infinibane. Logical HCA Runtime 
Environment 


deyices. common. 1BM. Lo rte 6. -l.7.-2 COMMITTED Inriniibanc!) Common RUNTLME 


Environment 
udapl.rte 61.721 CONMITTED UDAPL 
Path: /etc/objrepos 
bos.mpo4 6-17-22 COMMITTED Base Operating System 64-bit 


Multiprocessor Runtime 
deyices,. chro. IBM. Lanca- -rte 6 1.7-1 COMMITTED Infinibanc. Logical HCA Runtime 
Environment 


cdeyices. common., IBM. Libo rte 6.l.7-2 CONMNMITTED Inriniibanc) Common RuUNTLME 


Environment 
udapl.rte 6-1.7- COMMITTED UDAPL 
第 二 步 ， 在 HMC 中 为 分 区 分 配 InfiniBand 卡 资源 。 
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CIO 如 图 11-7 所 示 ， 打 开 HMC ERAH, ARANKA, TE PiuserRHRR$E BO 
置 ” 一 “管理 概要 文件 ” 


r — 一 
(8) localhost: Hardware Management Console Workplace (V7R7.4.0.0) - Mozilla Firefox: IB 
—- 4. — m a — —pÓáslüál— 00 s  ——M 


EOAR] https//10.20.0.120/hmc/connects/mainuiFrameset;jsp 


Hardware Management Console 


<>| 02MB 


全 | Systems Management Properties 


Y 


Ej Welcome D 


日 四 Systems Management 
日 Servers 
A4-Server-9131-52A-SN6513(| 
C4-Server-8204-EBA-SNO601( 
C4-Server-8204-EBA-SNOG8B( 
E Server-8205-EGB-SNOGEOE3 
由 ut Custom Groups 


eec [nane 
à] dbzcloudcfmo 回 
[^ Ig dbzcoudmo 


LE 


Tasks: db2cloudcfü 
Properties 
Change Default Profile 
Operations 


hb System Plans 


B HMC Management 


be Service Management 


Aba 


Javascript:menultemLaunchAction(); 


hscroot | Help | Logoff 


^ 


Manage Profiles 


Manage Custom Groups - | 
Save Current Configuration 
"-UDZUCUUUmTU AU Linux 


| Tasks v | Views™ | 


ant 和 |Reference 人 
Code 


Configuration 
由 Hardware Information 


由 Dynamic Logical Partitioning 


图 11-7 HMC 管理 界面 


itered:2 Selected: 1 


B] Console Window 
Æ Serviceability 


LU 


(2) 在 打开 的 概要 文件 中 ,选择 HCA， 可 以 看 到 ， 在 本 机 上 有 两 块 HCA 卡 ， 其 中 有 一 块 
是 用 来 连接 扩展 柜 的 ， 要 分 配 的 就 是 剩 下 的 这 一 块 ， 即 HMC Managed 属性 为 “是 ”的 这 一 块 ， 


如 图 11-8 所 示 。 


(lj) localhost: 管理 概要 文件 - Mozilla Firefox: IBM Edition. 


LC SUP PA] https//10.20.0.120/hmc/wcl/T6347stableTop, d6e0d6e 
XusrBEXÓEEU: db2cloudmi1 @ db2cloudmi1 @ Server-8205-E6B- SNOGEQ0E3P-Down - 
db2cloudm1 
General Processors Memory | I/O goes Controlling j (7 td 


要 在 此 分 区 概要 文件 中 配置 主机 通道 适配器 《HCA) ， 请 在 下 未 中 选择 一 个 适配器 ， 然 后 单 击 " 配 
置 "来 输入 相应 信息 。 


(GUID Index GUID Capability HMC Managed. 


| | Select Physical locations 


C 


U78AA.001.WZSGMMD-P1-C2 未 分 配 


未 分 配 未 分 配 


未 分 配 | 未 分 配 


U78AA.001.WZSGMMD-P1-C8 未 分 配 


= 


图 11-8 “分配 InfiniBand 卡 资源 


(3) 在 弹出 的 HCA 卡 资源 分 配 界 而 中 ， 可 以 看 到 两 个 可 以 编辑 的 选项 ， 


一 个 是 GUID 


index, 这 个 表示 这 块 HCA 卡 分 配给 这 个 分 区 后 的 编号, 这 个 编写 可 以 是 1~16 中 的 任何 一 个 ， 
但 是 要 保证 同一 物理 机 如 上 不 同 的 分 区 不 会 出 现 冲 突 。 在 实践 中 ， 建 议 分 配 的 HCA 卡 GUID 


号 和 分 区 号 保持 一 致 。 
男 一 个 是 Capability 选项 ， 
用 四 种 分 配方 式 : 
e Dedicated( 专 用 ) : 分 配 100% 的 资源 。 
e High( 局 ): 分 配 25% 的 资源 。 
e Medium( 中 ): 分 配 12.5% 的 资源 。 
e Low( 低 ): 分 配 6.25% 的 资源 。 


该 选项 表示 分 配 多 少 资源 给 该 分 区 ， 可 以 有 低 、 


等 、 高 和 专 
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在 本 项 目 中 ， 因 为 两 个 分 区 共享 一 块 HCA 卡 ， 所 以 选择 High( 高 )， 如 图 11-9 所 示 。 


(8) localhost: 管理 概要 文件 - Mozilla Firefox: IBM Edit... 
| HCA Configuration — Adapter ID - db2cloudmi | 
-- Host Channel Adapter (HCA) configuration 


Use the fields below to specify the Globally Unique Identifier 
(GUID) and the capability setting for the selected adapter. 


Adapter settings 


The GUID assigned to the partition must be an integer 
value that falls within the specified GUID index range. 


GUID index range : 1-16 
GUID index: 


Capability : 


OK | Cancel | Help | 


javascriptCSBUpdateInputFromOption(W63c8_opt_2,W63c8) X B3 


图 11-9 设 定 属性 


(4) 编辑 完成 并 保存 ， 随 后 在 该 分 区 上 激活 该 概要 文件 。 重 新 登录 到 该 分 区 的 操作 系统 
上 ， 用 下 面 的 命令 可 以 查看 该 分 区 上 的 HCA 卡 信 息 : 


=bash=-3.2$ lesdey =-Ce adapter |grep =i i9 
iba0 Available InfiniBand host channel adapter 


上 上 面 的 输出 表明 该 分 区 上 的 HCA 卡 资源 分 配 成 功 ， 重 复 上 面 的 步骤 为 剩 下 的 三 个 分 区 分 
Hi HCA 卡 资源 。 

第 三 步 ， 为 分 区 配置 InfiniBand 网 络 。 

首先 ， 需 要 在 每 台 分 区 上 创建 icm (InfiniBand Communication Manager) ， 在 AIX 系统 上 
使 用 “smitty icm” 创 建 icm， 如 下 所 示 : 


=bash=3.,2; smitty icm 


Add an Infiniband Communication Manager 
Move cursor to desired item and press Enter. 


Add an Infiniband Communication Manager 


Name IB of Communication Manager to Add 
Move cursor to desired item and press Enter. 


| 
| 
| 
| 
| ILEN | 
| 
| 
| 


| 
Fl1-Help F2-Refresh F3-Cancel | 
F8=Image FlO-Exit Enter-Do | 
El1| Sel n=Find Next | 
FE9+----------------------------------------------------------------------- 一 -一 十 


使 用 默认 的 名 称 “i ， 设 置 icm 相关 参数 ， 保 持 黑 认 即 可 ， 可 以 用 命令 Isdev AF A 


462 


第 113 DB2 pureScale 集群 数据 库 fp 


建 的 icm: 


=bashħh=3,.2ọ ledevy =C | grep icm 


icm Available Infiniband Communication Manager 


创建 icm 完成 之 后 ， 接 下 来 需要 配置 InfiniBand 卡 的 IP 地 址 。 大 家 知道 ，DB2 pureScale 
集群 中 成 员 节 点 和 CF 节点 之 间 的 通信 和 是 通过 RDMA 协议 ， 而 不 是 IP 网 络 。 这 里 配置 的 全 地 
址 被 集群 管理 软件 TSA 用 来 监控 集群 状态 。 在 前 面 也 提 到 过 , 每 一 台 Power 740 上 的 InfiniBand 
卡 都 有 爽 个 端口 ， 而 且 每 个 分 区 都 可 以 同时 使 用 这 两 个 病 口 。 本 案例 中 ， 将 为 CF 节点 配置 2 
个 InfiniBand 端口 ， 而 对 成 员 节 点 ， 仅 配置 1 个 InfiniBand 端口 。 

下 和 面 讲解 一 下 如 何 为 成 员 市 点 配置 IP 地 址 ， 步 又 如 下 : 

(1) 运行 smitty inet， 选 择 “Change / Show Characteristics of a Network Interface”， 在 弹 

出 的 对 话 框 中 选择 ib0。 


-la8n=3.2 Smitty inet 


Necwork Interface Selection 


Move cursor to desired item and press Enter. 


Available Network Interfaces | 
Move cursor to desired item and press Enter. | 


enO 04-00 Standard Ethernet Network Interface 
enl 04-01 Standard Ethernet Network Interface 
en2 05=00 Standard Ethernet Network Interface 
en3 05=01 Standard Ethernet Network Interface 
eto 04-00 IEEE 802.3 Ethernet Network Interface 


et2 05-00 imke 802.3 Einernet Network Interface 


| 
| 
| 
| 
| 
| 
| 
| 
| | 
| etl 04-01 IEEE 802.3 Ethernet Network Interface | 
| | 
| et3 05=01 IEEE 802.3 Ethernet Network Interface | 
| 

| 

| 

| 

| 


ib0 IP over Infiniband Network Interface | 
mlo N/A | 
| 
Fl-Help F2-Refresh F3-Cancel 
F8-Image FlO-Exit Enter-Do | 
Pijl EG] n-Find Next | 


F9 


(2) 配置 ib0 的 具体 参数 ， 包 括 “INTERNET ADDRESS (dotted decimal)" , “Network Mask" . 
“HCA Adapter" 4l * Adapter's port number" . IP 地 址 根据 规划 表 11-3 进行 配置 ， 其 余 参 数 使 
用 默认 值 即 可 : 


=bāash=3-2; Smitty 1Nnet 
Change / Show an IB Interface 


Type or select values in entry fields. 


Press Enter AFTER making all desired changes. 
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[ TOP] [Entry Fields] 
Network Interface Name 3: [510 
INTERNET ADDRESS (dotted decimal) [工人 QQ TI 
Network MASK (hexadecimal or dotted decimal) [255 2559. 25510] 


IPV6 ADDRESS (colon separated) [] 


Prefixlength [ 
HCA Adapter [iba0] + 
* Adapter's port number [1] +# 
Partition Key [OxFFFF] F 
MTU [555 32) +# 
Queue Sizes [4000] +# 
QKey [HI TIC] 十 
Superpacket QU E J 
Interface Specific Network Options 
MORETE 
F1-Help F2-Refresh F3-Cancel F4-List 
F5-Reset F6-Command F7-Edit F8-Image 
F9-Shell Fl10-Exit Enter-Do 


(UB KREBS IP 3E SL NO EE T6 fo CF 节 扣 的 配置 类 似 ， 根据 规 划 为 其 ib0 9m H AeA IP 地 址 


为 10.10.10.2. 


为 了 提升 CF 节点 的 数据 吞吐 量 , 除了 配置 ib0 外 ,还 可 以 同时 为 其 配置 另外 一 个 InfniBand 


闹 口 ， 即 ib1。 对 于 另外 一 个 端口 ib1， 需 要 手动 创建 ， 还 是 用 “smitty inet” 交 互 式 界 面 ， 但 选 
择 “Add a Network Interface" , A7% “Add an IB Network Interface”。 在 弹出 的 配置 荣 上 
中 为 新 添加 的 ibl 9m O igx à “INTERNET ADDRESS (dotted decimal)" . “Network Mask”、 
“ Network Interface Name". “HCA Adapter” F4“ Adapter's port number ". H; “Network Interface 
Name" WX ibl, “HCA Adapter" 137jiba0, "Adapter's port number" 8X 2, KEH IB 
-F iba0 的 第 2 个 端口 : 
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=bashn=3.2; Smitty n 
Change / Show an IB Interface 


Type or select values in entry fields. 


Press Enter AFTER making all desired changes- 


[TOP] [Entry Fields] 
Network Interface Name 并 加 站 
INTERNET ADDRESS (dotted decimal) [Rae esie a] 
Network MASK (hexadecimal or dotted decimal) 2530 as eem s S DNI 


IPV6 ADDRESS (colon separated) [.] 


Prerixlengehn [] 
HCA Adapter [iba0] 十 

* Adapter's port number L2] tid 
ParcticLlon Key [OXFFFF] + 
MTU [5559324 td 
Queue Sizes [4:000 ] +# 
OKey [Ox1E] 十 
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Superpacket OTE + 
Interface Specific Network Options 
MORPET] 
Fl-Help F2-Refresh F3-Cancel FA-List 
F5-Reset F6-Command tele F8-Image 
F9-Shell Fl0O0-Exit Enter-Do 


这 样 就 完成 了 第 一 台 Power 740 的 InfiniBand 网 络 设 置 。 用 类 似 的 方法 为 第 2 台 Power 740 
服务 器 进行 设置 。 
最 后 ， 所 有 分 区 的 IP 地 址 和 主机 名 都 要 添加 到 /etc/hosts 文件 中 ， 如 下 所 示 : 


A dias oed db2memberO 
I2 Se db2member1 
T72- 1675015 Quod CFO 
172.16.50.16 Quom 


10.10.10.1 db2member0-ib0 
10.10.10,.2 Glo2CE0=150 
OE Oe cdlo2CF0O=101 
10.10.10.3 db2memberl-ib0 
0 és52CF1-=150 
IC PESE e e eH T 


第 四 步 ， 确 认 InfiniBand 网 络 是 否 成 功 ， 检 和 碍 /etc/dat.conf 文件 的 配置 内 容 ， 如 下 所 示 : 


Eee ae 
"elei. db ipu wu 

woe BUL. 2 iatowonsieueeeuielse en oe a Iodbe e) css TE OE 
"d'alenz// Suo 2 SUL ow n 


其 中 ,第 1 列 hca0 M heal 表示 这 人 台 机 器 上 使 用 了 2 个 infiniBand 接口 ,第 1 行 的 “/dev/iba0 
1 ib0” 表 示 iba0 上 的 第 1 个 接口 ib0。 同 理 第 2 行 的 “/dev/iba0 2 ib1” 表 示 iba0 上 的 第 2 个 接 
O ibl. 


11.3.3 HEA: 存储 与 文件 系统 


在 DB2 pureScale 集群 环境 中 ，GPFS 文件 系统 将 创建 在 DS 5300 KEFE. FAIR 
下 配置 步骤 。 

CIO 检查 多 路 径 驱 动 软件 

为 了 使 Power 740 服务 器 识别 存储 上 划分 的 vdisk CLUN) ， 需 要 在 服务 器 上 安装 多 路 径 驱 
动 。 在 Power 平台 上 ， 多 路 径 驱 动 软件 为 sddpcm， 可 以 用 下 面 的 lslpp 命令 检查 是 否 安 装 成 功 : 


=bashħh=3.2$ lslpp =1 | grep pem 
devices.sddpcm.61.rte 2.6,.1.0 COMMITTED IBM SDD PCM for AIX V6l 


如 果 安 装 成 功 ， 可 以 用 命令 pcmpath 查看 到 设备 : 


-bash-3.24 pcmpath query device 
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Total Active/Passive Devices : 39 


DEV#: © DEVICE NAME; haliLiske TYPE; 1618 ALGORITHM: Load Balance 
SERIAL: 600A0B80006E668400007E614F582AAA 


Pathi Adapter/Path Name State Mode Select EEOE 
0 fscsi0/pathO0 OPEN NORMAL 313871 1 
1 fscsi0/path3 OPEN NORMAL 310559 0 
gu Eo cs a OPEN | NORMAL 660 0 
S Escsu 0 pat 2 OPEN | NORMAL 660 0 
DEME 9 DEVICE NAMES hoiskS TYPE; 1818 ALGORITHM: Load Balance 


SERIAL: 600A0B80006E5E0400007B474F592352 


Path# Adapter/Path Name State Mode Select LEEOE 

0 fscsi0/path0 OPEN NORMAL 271007 1 

1 fscsi0/path3 OPEN NORMAL 267261 0 

D fecsi0/patni OPEN NORMAL 660 0 

Sp fscsi0/path2 OPEN NORMAL 660 0 
[ER NM lS OE ALGORITHM: Load Balance 


SERIAL: 600A0B80006E5E0400007B414F582AE0 


Path# Adapter/Path Name State Mode Select lass eue 

0 d scm oss OPEN | NORMAL 203951 1 

1 fscsi0/path3 OPEN NORMAL 279421 0 

Dos fscsi0/patnl OPEN | NORMAL 660 0 

3% fscsi0/path2 OPEN NORMAL 660 0 
[DER NM es ALGORITHM: Load Balance 


SERIAL: 600A0B80006E668400007E724F59235D 


Pathi Adapter/Path Name State Mode Select HONO OS 
0 fscsi0/patho0 OPEN | NORMAL 288359 1 
1 piscis ee en OPEN NORMAL 284241 0 
pus fecesiO/partni OPEN NORMAL 660 0 
9s fscsi0/path2 OPEN NORMAL 660 0 
2. Ri & PVID 


PVID 是 AIX 系统 中 用 于 识别 物理 卷 PV) 的 序列 号 ， 束 类 似 每 个 人 的 身份 证 号 一 样 。 所 

有 用 于 DB2 pureScale 的 磁盘 , 包括 用 于 GPFS 文件 系统 和 仲裁 盘 的 人 磁盘, 在 所 有 的 节点 上 都 必 
须 具 有 相同 的 PVID， 给 人 磁盘 分 配 PVID 的 步骤 如 下 : 

CD 选 定 一 个 节点 作为 当前 节点 ， 使 用 lspv 命令 查看 系统 上 的 hdisk 信息 和 PVID 信息 。 

(2) 在 当前 节点 上 ， 给 所 有 的 hdisk 设置 PVID， 例 如 给 hdisk9 设置 PVID， 命 令 如 下 所 示 : 


chdev -1 hdisk9 -a pv-yes 


(3) 在 其 他 节点 上 ， 通 过 rmdev 命令 删除 所 有 磁盘 原 有 的 PVID 信息 ， 例 如 删除 hdisk9 


rmdev -dl hdisk9 
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(4) 在 其 他 节点 上 运行 cfemegr 命令 ， 这 样 系统 将 从 存储 中 重新 检索 PVID， 即 在 第 (2) 
步 中 设置 的 PVID 信息 ， 这 样 所 有 磁盘 在 所 有 节点 上 的 PVID 就 完全 一 致 了 。 
3. 文件 系统 规划 


在 本 次 实施 过 程 中 ，GPFS 文件 系统 规划 如 表 11-4 所 示 ， 其 中 db2fs1 用 于 实例 共享 目录 ， 
db2data 用 于 存放 数据 ，db21log 用 于 存放 日 志 ，db2backup 用 于 存放 备份 。 


R 11-4 GPFS 文件 系统 规划 表 
文件 系统 容量 TT 
db2fs1 /db2sd 20120419165827 数据 库 实例 共享 目录 hdisk2 


hdisk3 
hdisk4 
"m hdisk5 
db2data /db2 fs/db2 data 存放 数据 3T 
hdisk6 
hdisk7 
hdisk8 


| hdisk9 
db2log /db2fs/db2log T£ H s 800G MM 
iks10 


hdisk11 

hdisk12 
db2backup /db2fs/db2backup 存放 备份 2T 

hdisk13 

hdisk14 


NA | E isis 


X 11-4 中 最 后 一 行 是 一 个 额外 的 hdisk15( 存 储 上 划分 的 LUN, 对 应 主机 上 的 PV), hdisk15 
个 用 来 作为 整个 DB2 pureScale 集群 的 仲裁 盘 ， 对 空间 的 需求 很 小 ，5S0M US T - 
实际 上 ，DB2 pureScale 集群 只 需要 一 个 GPFS 共享 文件 系统 即 可 安装 和 运行 , 但 这 样 的 话 
只 能 把 实例 共享 目录 、 数 据 和 日 志 放 在 同一 个 文件 系统 上 。 生 产 环境 中 ， 往 往 考虑 把 这 些 目录 
放 在 不 同 的 文件 系统 上 以 提高 性 能 和 便于 管理 。 
11.3.4 ”检查 与 配置 


本 廊 草 点 讲 述 正式 安 北 前 的 软 价 件 环境 检查 和 配 转 。 
1. 检查 操作 系统 版 本 


DB2 pureScale 可 以 运行 在 AIX 6.1 或 AIX 7.1 上 ， 如 果 是 6.1 建议 使 用 TL6 SP6。 如 果 使 
用 更 早 的 版 本 ， 需 要 安装 不 同 的 操作 系统 补丁 ， 具 体 要 求 请 参考 DB2 pureScale 信息 中 心 。 

可 以 用 命令 “oslevel -$” 碍 看 当前 安 闭 的 操作 系统 厂 本 ， 如 下 所 示 ， 其 中 输出 串 
“6100-06-06-1140” 中 的 “6100” 表 示 AIX 版 本 为 6.1，“06-06” 表 示 子 版 本 号 为 TL6 SP6. 


-bash-3.24 oslevel -s 
6100-06-06-1140 
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2. 检查 C++ 运行 环境 


3— 


DB2 pureScale 需要 C++ 运行 环境 (xlC runtime environment) 的 支持 ， 要 求 的 最 低 版 本 为 
9.0.08。 可 以 用 命令 lslpp ARERR S FERI C++ 运行 环境 ， 如 下 所 示 ， 本 环境 中 C++ 
版 本 为 11.1.0.2: 


bash=3,2; Llelpp =l 1C., rte 
Fileset Level State Description 


Paths /usr/1lilb/objrepos 
xlC.rte 11.1.0,2 COMMITTED XL C/C++ Runtime 


3. MA SSH 


DB2 pureScale 还 需要 OpenSSH If] Sz f, 最低 版 本 要 求 是 4.5.0.5302， 如 下 所 示 ， 本 环境 中 
OpenSSH 版 本 为 5.8.0.6101: 


lars ss 
Fileset Level State Delsien ee Ne 


path: /usr/1lilb/objrepos 


openssh.base.client 5.8.0.6101 COMMITTED Open Secure Shell Commands 

openssh.base.server 5.8.0.61011 COMMITTED Open Secure Shell Server 

openssh man. en s 5-8-0610 COMMITTED Open Secure Shell 
Documentation = U.S, English 


Path: /etc/objrepos 
openssh.base.client 5.8.0.6101 COMMITTED Open Secure Shell Commands 
openssh.base.server 5.8.0.61011 COMMITTED Open Secure Shell Server 


安装 了 OpenSSH 之 后 , REN root 用 户 和 实例 用 户 配 置 ssh 信任 关系 ， 这样 各 方 点 相互 之 
间 就 可 以 通过 ssh. 的 方式 执行 远程 命令 了 。 
以 root 用 户 为 例 ， 执 行 以 下 步骤 配置 : 
(1) 在 所 有 节点 上 使 用 ssh-keygen 命令 生成 公 钥 / 私 钥 对 : 


Eas SSh=-keygen -t dsa 


该 命令 执行 过 程 中 会 提示 用 户 输入 信息 ， 直 接 按 回 车 键 ， 执 行 完 后 会 在 ~/.ssh 目录 下 生成 
密 钥 文件 id dsa〈 私 铀 ) 和 id dsa.pub (A4) à- 

(22 将 所 有 方 点 上 生成 的 公 钥 文件 内 容 合 并 到 一 个 名 为 authorized keys 的 文件 中 ， 并 将 
authorized keys 找 贝 到 所 有 节点 上 的 ~/.ssh 目录 下 ， 并 使 用 命令 “chmod 644 authorized keys" 
修改 其 权限 。 

(3) 进行 验证 。 例 如 ， 在 db2member0 上 执行 下 和 面 的 命令 来 验证 ssh 信任 关系 是 否 配 置 
成 功 : 

-bash-3.24 ssh db2memberl date; ssh db2CF0 date;ssh db2CF1 date 
Sat Jul 7 16:12:04 BEIST 2012 


Sart Jul 7 16:12:03 BEIST 2012 
Sart Jul 7 16:12312 BEIST 2012 
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4. 配置 NTP (Network Time Protocol? 


NTP 是 用 来 使 计算 机 之 间 时 间 同 步 化 的 一 种 协议 ， 它 可 以 使 计算 机 对 其 服务 器 或 时 钟 源 
(如 石英 钟 、GPS 等 等 ) 做 同步 化 ， 它 可 以 提供 高 精准 度 的 时 间 校 正 。 

DB2 pureScale 集群 中 多 个 成 员 节 点 和 CF 节点 一 起 工作 , 也 需要 使 用 NTP 协议 确保 这 些 市 
点 之 间 的 时 间 同 步 。 下 面 给 出 配置 NTP 的 具体 步骤 ， 其 中 布点 172.16.50.11 为 NTP 服务 器 ， 
其 他 节点 为 NTP 客户 端 ， 这 样 客户 端 和 服务 器 进行 同步 从 而 实现 所 有 节点 的 时 间 完 全 一 致 。 

在 节点 172.16.50.11 上 配置 NTP 服务 器 的 步骤 如 下 : 

C1) 编辑 /etc/ntp.conf 文件 ， 添 加 如 下 内 容 ， 其 中 “server 127.127.1.0” 表 示 NTP 守护 进 

程 与 其 自己 的 系统 时 钟 同步 : 

“bash 93000 tau eic Ee 


server 127.127.1.0 
driftrile /etco/ntp.drirt 


ctcracefile ACID CAE deo 


(2) 编辑 /etc/rc.tcpip 文件 , 将 以 下 条 目前 面 的 注释 符 写 # 去 挥 ， 这样 NTP 服务 器 会 目 动 局 


SEE 要 


(3) 启动 NTP 服务 : 


STtTartTsrEe -5 xntpE 


在 其 他 节点 上 配置 NTP 客户 端的 步骤 如 下 : 
(1) 编辑 /etc/ntp.conf 文件 ， 指 定 NTP RS Z&3 HE 7g 172.16.50.11， 如 下 所 示 : 


pldcnoo tail =f Ic I CONE 
server 172.16.50.11 
driftfile /ete/ntp drift 


ctcracefile /erte/ntp- trace 


(2) 编辑 /etc/rc.tcpip 文件 ， 将 以 下 条 目前 面 的 注释 符号 # 去 反 ， 这 样 NTP 服务 器 会 自动 
局 动 : 


SEE 


(3) 启动 NTP 服务 : 


startsrc -s xntpd 
(4) 使 用 ntpdate 命令 和 NTP 服务 器 完成 同步 : 
ntpdate = 172.16.50.11 
5. 局 用 IOCP (I/O Completion Ports) 
在 AIX 平台 上 启用 IOCP 后 ， 可 用 来 处 理 AIX 操作 系统 上 的 异步 IO CAIOO 请 求 ， 从 而 
改进 整体 系统 性 能 。 启 用 IOCP 的 步骤 如 下 : 
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输入 lslpp 命令 ， 检查 系 统 上 是 否 已 安装 了 IOCP 模块 。 


pousse su Lleslpp =l lO08.1OCGD, rte 
Fileset Level State Description 
Path: /usr/lib/objrepos 
bos.iocp.rte ©1721 COMMITTED 1/0 Completion Portes API 


Path: /etc/objrepos 
DOS- LOCP -o FTE 6.1.6.0 COMMITTED I/O Completion Ports API 


输入 lsdev 命令 ， 检 查 IOCP 端口 的 状态 是 否 为 “可 用 ” (Available) . 


$ lsdey =Ce 10€ 


£k ARA h IZ VÀ. PS PURO: 


iocpO0 Available I/O Completion Ports 


如 果 IOCP 端口 状态 为 “已 定义 ” (Defined) ， 那 么 将 状态 更 改 为 “可 用 ” (Available) ， 
具体 步骤 如 下 : 
首先 ， 以 root 用 户 喘 份 登录 至 服务 器 并 发 出 以 下 命令 : 


# smitty iocp 


随后 , 选择 更 改 /显示 VO 完成 端口 的 特征 。 将 已 配置 的 系统 重新 启动 时 的 状态 由 “已 定义 ” 
(Defined) 更 改 为 “可 用 ” (Available) 。 
最 后 ， 再 次 输入 lsdev 命令 以 确认 IOCP 端口 的 状态 已 更 改 为 “可 用 ” (Available) 。 


人 小 技巧 : 为 所 有 DB2 运行 环境 开启 IOCP 
不 仅仅 是 在 DB2 pureScale 环境 开启 IOCP 可 以 提升 性 能 ,在 单 节 点 单 分 区 环境 以 及 


` 
x 


DPF 环境 开启 IOCP 都 可 以 提升 IO 性 能 ， 所 以 建议 开启 它 。 


6. 创建 组 和 用 户 


司 普通 的 DB2 实例 一 样 ，DB2 pureScale 集群 实例 也 需要 有 实例 用 户 和 Fenced 用 户 ， 而 且 
要 确保 这 两 个 用 户 在 所 有 的 成 员 和 CF 市 点 上 都 存在 ， 并 且 基 有 同样 的 uid 和 gide KRJ HP, 
使 用 下 面 的 实例 用 户 和 Fenced 用 户 ， 如 表 11-5 所 示 : 


表 11-5 创建 组 和 用 户 


用 户 类 型 组 名 
实例 用 记 db2iadml 


Fenced 用 户 db2sdfel db2fadml 
下 面 是 具体 步骤 。 
第 一 步 ， 创 建 用 户 组 : 


mkgroup id=999 db2iadml 
mkgroup id=998 db2fadml 


470 


2 114 DB2 pureScale ft ££ ZA 46 Å f 


第 二 步 ， 创 建 实 例 用 户 和 Fenced HP: 


mkuser id-1004 pgrp=db2iadml groups-db2iadml1 home-/db2home/db2sdinl db2sdinl 
mkuser id-1003 pgrp-db2fadml1 groups-db2fadml home-/db2home/db2sdfel db2sdfel 


第 三 步 ， 设 置 实 例 用 户 和 Fenced 用 户 的 密码 : 


passwd db2sdin1 
passwd db2sdfel 


在 所 有 节点 上 执行 上 面 的 命令 。 


11.3.5 “正式 安装 
1. 安装 DB2 pureScale 软件 


所 有 的 准备 工作 完成 之 后 ， 束 可 以 开始 正式 安装 DB2 pureScale 了 ， 本 案例 选择 的 DB2 版 
本 为 10.1， 只 要 选择 一 个 节点 作为 初始 安装 厄 点 即 可 ， 本 案例 选择 db2memberO 市 点 。 


PN 


Ii 


小 技巧 : 使 用 db2prereqcheck 命令 进行 安 

DB2 pureScale 的 安装 过 程 不 复杂 ， 但 是 对 主机 、 网 络 和 存储 有 要 求 ， 为 了 防止 正式 
安装 时 出 错 ， 可 以 使 用 db2prereqcheck 命令 进行 检查 ， 命 令 格 式 如 下 : 

bash-3.00# ./db2prereqcheck -p -v 10.1.0.0 


在 db2 member0 节点 上 ， 使 用 ROOT 用 户 运 行 安装 包 中 的 “db2 install ”命令 进行 安装 ， 
根据 提示 输入 一 些 必 要 信息 ， 比 如 安装 目录 等 ， 具 体 命 令 如 下 : 


Too senes TL 


整个 安装 过 程 大 概 需 要 几 分 钟 ，TSA 和 GPFS 软件 包 会 在 这 个 过 程 中 一 并 安装 。 成 功 安装 
后 ， 可 以 使 用 db21s 命令 来 查看 : 


-bash-3.25 /usr/local/bin/db2ls 


Install Parth Level Fix Pack Special Install Number rnstall 
Date Installer UID 

OPE TEM Acto D Vior TOTIFOTO 0 Fri Apr 20 
11;06:11 2012 BEIST 0 


2. 创建 实例 


首先 , 根据 11.3.3 节 的 文件 系统 规划 , 使 用 hdisk2 来 创建 DB2 pureScale 共享 目录 的 GPFS 
文件 系统 : 


./db2cluster prepare -instance shared dev /dev/hdisk2 


该 命令 执行 完成 之 后 会 创建 一 个 文件 系统 ， 名 称 自 动 为 db2f1， 挂 载 点 在 /db2sd_ 
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20120419165827, 挂 载 点 名 称 也 是 自动 生成 的 。 接 下 来 可 以 用 db2icrt 命令 来 创建 DB2 pureScale 
实例 : 
./db2icrt d a SERVER ENCRYPT -p 50000 —-m db2memberÜ -mnetdb2member0-ibO0 -cf db2CFO 


nto ummisieanceessbimeddq ned? So 0] 02] 90 9562 toa /ov /nk 0 
=u @lo2sdrel cloz2saini 


该 命令 各 个 参数 的 意义 如 下 : 

-d: 开局 debug 模式 ， 获 得 更 多 的 诊断 信息 。 

-a SERVER ENCRYPT: 实例 的 认证 方式 为 服务 器 端 认证 。 

-p 50000: 实例 将 采用 50000 作为 服务 端口 。 

-m db2member0 -mnetdb2member0-ib0: 集群 的 第 一 个 成 员 节 点 ，db2member0 为 以 太 网 卡 
接口 的 主机 名 ，db2member0-ib0 X InfiniBand 网 卡 接口 的 主机 名 。 

-cf db2CF0 -cfnetdb2CF0-ib0: 集群 的 第 1 个 CF 5, db2CFO 为 以 太 网 卡 接口 的 主机 名 ， 
db2CF0-ib0 为 第 1 个 InfiniBand 网 卡 接口 的 主机 名 。 

-instance shared dir /db2sd 20120419165827: 实例 的 共享 目录 。 

-tbdev /dev/hdisk15: 集群 的 仲裁 租 为 hdisk15。 

-s dsf: 实例 的 类 型 为 DB2 pureScale 实例 。 

-u db2sdfel: fenced 用 户 名 。 

db2icrt 执行 完 之 后 ，DB2 pureScale 集群 实例 db2sdinl 已 经 被 创建 出 来 了 ， 只 不 过 现在 集 
群 中 只 有 一 个 成 员 节 点 和 一 个 CF 市 态 。 接 下 来 需要 添加 男 外 的 成 员 市 点 和 CF 节点 。 

添加 第 二 个 成 员 节 点 和 CF T 点 : 


./db2iupdt -add -m db2member1 -mnetdb2memberl-ib0 db2sdin1 
sy eller eros. =adad ene /on evn ello el db2sdini 


pi mit, CF 节点 可 以 使 用 多 个 InfiniBand 接口 来 提高 带宽 和 高 可 用 性 ， 下 面 为 2 个 
CF 节点 增加 第 2 个 InfiniBand 端口 : 


Aele ee =updare rel on =cfnetcdhb2CFrFO=ib0, dob2CrF0=ib1 db2sdini 
- /do2iupadt =updare =ef do2CF1 =cfnetchb2CF1=ib0, dob2CF1l=ib1 db2sdini 


至 此 ，DB2 pureScale 的 集群 和 实例 创建 已 经 完成 ， 可 以 切换 到 实例 用 户 db2sdin1， 然 后 设 
置 DB2COMM 环境 变量 : 


db2set DB2COMM=tcpip 


然后 运行 db2start 命令 局 动 实例 , 实例 局 动 成 功 后 可 以 用 “db2instance -list” 查 看 实例 状态 : 


-bāasn-3.2$ cdlo2instance -list 


ID TYPE STAT HOME HOST CURRENT HOST 
ALERT PARTITION NUMBER OG GORT NETNAME 

0 MEMBER SEARED db2member0 db2member0 
NO 0 0 db2memberO0-1ib0 

jr MEMBER STARTED db2memberl db2member1 
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NO 0 0 db2memberl-ibO0 
128 CE PRIMARY Che ERI eo GRO 
NO = 0 co Z1 090 
129 CE PEER db2CF1 eiie 2E Ei 
NO = 0 cuoi 90 
HOSTNAME STATE INSTANCE STOPPED ALERT 
ete CE1 ACTIVE NO NO 
euo ACTIVE NO NO 
db2memberl1 ACTIVE NO NO 
db2memberO ACTIVE NO NO 


11.3.6 ”数据 库 部 署 


根据 11.3.3 节 的 规划 , 需要 创建 3 个 GPFS 文件 系统 db2data、db2log 和 db2backup 供 mydb 
数据 库 使 用 。 可 以 使 用 DB2 pureScale 提供 的 集成 命令 db2cluster 来 创建 这 些 文件 系统 ， 这 可 以 
在 任何 一 个 成 员 或 CF 节点 上 用 root 用 户 执行 。 下 面 是 具体 的 步骤 : 
(1) 创建 文件 系统 db2data 


db2cluster -CFS -CREATE -FILESYSTEM db2data -DISK 
/dey/hdisk3, /dey/hndisk4, ace classes An Sl A Sel elo =MOUNT 
/db2fs/db2data 


各 个 参数 的 解释 如 下 : 
-CFS: 表示 要 使 用 文件 系统 管理 的 相关 功能 。 
-CREATE -FILESYSTEM db2data: 新 创建 db2data 文件 系统 。 
-DISK /dev/hdisk3,/dev/hdisk4,/dev/hdisk5,/dev/hdisk6,/dev/hdisk7,/dev/hdisk8: 文件 系统 建立 
在 列表 中 的 磁盘 上 。 
-MOUNT /db2fs/db2data: 指定 文件 系统 挂 载 点 。 
(2) 创建 文件 系统 db2log 


db2cluster -CFS -CREATE -FILESYSTEM db2log -DISK /dev/hdisk9,/dev/hdisk10 -MOUNT 
2 


(3) 创建 文件 系统 db2backup 


cdio2cluster =-CFS -CREATE =PILESYÝYSTEM cloz2backup -DISK 
/dev/hdisk11, /dev/hdisk12, /dev/hdisk13,/dev/hdisk14 -MOUNT /db2fs/db2backup 


(45 创建 数据 库 mydb 


db2 create databasemydb AUTOMATIC STORAGE YES ON /db2fs/db2data DBPATH ON /db2£s/db210og 
(DIS: TED TOTO IDEEN S mE D IET YN 


11.3.7. NL His Bo 


DB2 pureScale 的 工作 负载 均衡 (WLB) 机 制 分 为 连接 级 别 和 事务 级 别 。 连 接 级 别 的 负载 
均衡 发 生 在 客户 咽 建 并 数据 库 连接 之 时 , 以 后 不 再 调整 ; 事务 级 别 的 负载 均衡 发 生 在 事务 边界 ， 
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需要 根据 数据 库 成 员 服 务 器 的 忙 朵 程度 动态 进行 调整 。 
在 DB2 pureScale 中 ， 目 动 客 户 端 重新 路 由 CACR) 功能 是 指 在 客户 端 连接 到 数据 库 集 群 
的 情况 下 ， 如 果 某 个 成 员 发 生 故 障 ， 则 会 目 动 地 将 应 用 程序 重新 连接 到 集群 中 其 他 成 员 上 。 
如 表 11-6 所 示 ， 针 对 Java 程序 和 非 Java 程序 ，DB2 pureScale 对 WLB 和 ACR 默认 文 持 
乍 阵 ， 例 如 事务 级 WLB 默认 情况 下 部 是 未 激活 的 。 


表 11-6 DB2 pureScale 对 WLB 和 ACR 默认 支持 矩阵 


设置 非 Java 应 用 
连接 级 WLB 激活 
事务 级 WLB 未 激活 
连接 后 ACR 激活 
连接 前 ACR 未 激活 


下 面 ， 详 细 曾 述 如 何 针 对 这 些 不 同 应 用 配置 工作 负载 均衡 和 目 动 客户 端 路 由 。 
1. Java 应 用 


Websphere 应 用 服务 器 (WAS ) 结合 后 台 DB2 数据 库 的 应 用 模式 在 客户 实际 生产 中 广泛 使 
用 ， 那 么 如 果 后 台数 据 库 是 DB2 pureScale 集群 呢 ? 在 这 种 环境 下 ， 如 何 来 配置 呢 ? 

对 于 Java 应 用 程序 ， 事务 级 别 的 工作 负载 均衡 缺 省 是 关闭 的 ， 连接 前 上 日 动 客户 端 路 由 也 是 
关闭 的 ， 这 样 导 作客 户 问 在 其 连接 属性 中 指定 的 成 员 服 务 器 宕 机 时 ， 不 会 日 动 路 由 到 其 他 存活 
K n HRS KF o 

下 面 讨 论 一 下 如 何 改 变 缺 省 设置 ， 使 WLB 和 ACR 正常 工作 。 

Hc. mæ WAS 服务 器 的 /etc/hosts 文件 中 添加 pureScale Ik n Jl 25-88 HJ. IP 地 址 和 主 
机 名 : 


I 9 2 Sees UST UD B db2member0 
qc 1650,12 db2member1 


其 次 ， 需 要 使 用 DB2 当前 版 本 自 带 的 JDBC 驱动 程序 ， 之 前 版 本 的 驱动 程序 目前 不 支持 
工作 负载 均衡 。 
最 后 ， 如 表 11-7 所 示 ， 需 要 在 WAS 应 用 服务 器 里 进行 相关 配置 。 


表 11-7 WLB 和 ACR 在 WAS 中 的 配置 


DriverManager 


连接 级 | 不 文 持 不 文 持 
WLB 


事务 级 | 在 “数据 源 > 资源 名 > 定制 属性 ” 增 | 增加 Connection 对 象 属性 : 
WLB 加 enableSysplexWLB 属性 : enableSysplexWLB=true 


enableSysplexWLB=true 


474 


第 113 DB2 pureScale 集群 数据 库 P 


( 续 表 ) 
DriverManager 
连接 前 | 方法 一 : 增加 DataSource 的 属性 : 方法 一 : 使 用 Properties 对 象 
ACR clientRerouteAlternateServerName=172.1 Properties props = new Properties(); 
6.50.12 props.put("user", "db2sdin1"); 
clientRerouteAlternatePortNumber-50000 props.put("password", "db2"); 
方法 二 : 首先 生成 JNDI， 绑 定 到 DB2; BS | props.put("enableSysplexWLB", "true"); 
后 在 WAS 管理 控制 台中 设置 cientReroute | props.put("clientRerouteAlternateServerName", 
ServerListJNDIName 指向 所 生成 的 JNDI。| "172.16.50.12"; 


props.put("clientRerouteAlternatePortNumber ", 
"50000"; 

Connection c = DriverManager.getConnection("jdbc: 
db2://172.16.50.11:50000/mydb", props ); 

方法 二 : 在 连接 串 里 增加 属性 

conn = java.sql.DriverManager 
.getConnection("1dbc:db2://172.16.50.11:50000/H 
LJRCCB:user-db2sdinl;password-db2; 


enableSysplexWLB-true;clientRerouteAlternate 
PortNumber-50000; 
clientRerouteAlternateServerName-1 72.16.50.12; 


1) 
连接 后 | 默认 为 enable， 发 生 ACR 时 系统 会 报错 | RAN enable, RÆ ACR 时 系统 会 报错 误 信 
ACR 误 信 息 ， 其 中 ERRORCODE 7j 4498, 息 ， 其 中 ERRORCODE 7j 4498, SOLSTATE 为 
SQLSTATE 为 08506 08506 


2. dE JAVA 应 用 


多 线程 DB2 CLI 程序 访问 DB2 pureScale 数据 库 ， 如 条 要 实现 WLB 和 ACR 功能 ， 需 要 配 
置 客户 端 db2dsdriver.cfg 文件 , 该 文件 存放 在 客户 端的 $9DB2HOME/sqllib/cfg 目录 中 。 下 面 是 一 
个 db2dsdriver.cfg 文件 的 配置 例子 : 


«renes EO DUC SH Th OU 

<DSN Collection> 

«dsn alias="alias1" name-2"namel" 

Duos serveril netl com" port="50000"/> 

<!-- Long aliases are supported --> 

«dsn alias-"longaliasname2" name="name2" 
hosr-"server2.netl.com" potrb-"5555L'"5 

<parameter name-"Authentication" value-"Client"/» 
< 

DONT Cole kon. 

<databases> 

<database name="db2member0" host="172.16.50.11" port="50000"> 


<parameter name="connectionLevelLoadBalancing" value="true" /> 
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«WLB» 

«parameter name-"enableWLB" value-2"true"/» 

<parameter name-"maxRefreshInterval" value-30/» 

«/WLB» 

«ACR» 

«parameter name-"enableAcr" value="true" /> 

<parameter name-"enableSeamlessAcr" value="true" /> 

<parameter name-"enableAlternateServerListFirstConnect" value="true" /> 
«alternate server list» 

Xserver name-"db2memberl" hostname-z"172.16.50.12" portz"50000" /> 
«/alternate server list» 

UC 

«/database» 

«/databases» 

<Oaramerters> 

<parameter name-"GlobalParam" value="Value"/> 

</parameters> 


</conftiguration> 


前 面 讲 了 不 同 应 用 是 如 何 配 置 工作 负载 均衡 和 目 动 客户 端 路 由 的 , 除 此 以 外 , 生产 环境 中 ， 

例如 SAP 应 用 、Oracle Tuxedo. IBM 

CICS 4&3 ll DB2 pureScale IRA, Hj 

pureScale 网 và 

以 考虑 采用 客户 端 指定 (CClient Affinity) 

的 方式 ， 这 种 方式 的 最 大 好 处 是 可 以 为 x 

SS OR CICS & 2 

客户 端 应 用 指定 特定 的 成 员 。 如 图 11-10 um 
- nus pureScale 成 员 2 

所 示 ， 每 台 CICS 服务 器 连接 到 指定 的 

» A HH E A HH M Y 

成 员 服务 器 ， 其 中 CICS 服务 器 1 连接 

到 成 员 1，CICS 服务 器 2 和 CICS 服务 

器 3 连接 到 成 员 2。 图 11-10 CICS 和 DB2 pureScale 成 员 服 务 器 连接 方式 


11.4 DBA 必须 掌握 的 : 
DB2 pureScale 实用 运 维 命令 


曾 有 人 用 “警察 ”的 视角 来 看 DBA 的 运 维 工 作 。 这 份 警 察 性 质 的 工作 分 为 两 部 分 : HS 
维护 就 是 日 常 巡 逻 以 维护 稳定 ， 处 Ah iE RE” TENURE. BARKE, 就 像 电 
视 剧 情节 一 样 ， 一 场 温 二 甜蜜 的 婚礼 ， 总 要 有 个 恶人 蹦 出 来 摘 乱 场面 ， 而 看 似乎 静 的 日 党 运 维 
工作 总 不 时 会 有 突如其来 的 事故 ，DBA 的 工作 性 质 真 是 透 看 一 个 字 一 一 “ 险 ”。 例如 当 出 现 紧 
总 事故 时 ， 哪 怕 是 在 睡梦 中 ， 一 个 电话 打 来 你 也 得 从 床上 扑 起 来 ， 用 最 短 的 时 间 解 决 问题 

实际 上 ，DBA 的 运 维 工作 包括 日 营 维 护 和 故障 处 理 ， 涵 兰 的 具体 内 容 包 括 软 件 安 闻 、 配 置 
优化 、 备 份 策略 选择 及 实施 、 数 据 恢复 、 数 据 移动 、 故 障 排 除 、 性 能 优化 等 一 系列 服务 。 
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上 述 工 作 内 容 也 完全 适用 于 DB2 pureScale 的 运 维 ， 那 么 与 单 节 点 相 比 ，DB2 pureScale 
数据 库 集 群 有 什么 需要 特别 注意 的 地 方 呢 ? 

从 某 种 程度 上 说 ，DB2 pureScale 降低 了 DBA 的 工作 量 。 

首先 ， 单 节点 DB2 数据 库 ， 因 为 其 自身 的 HADR 有 很 多 限制 ， 所 以 不 得 不 使 用 操作 系统 
级 别 的 高 可 用 方案 ， 例 如 AIX 平台 的 HACMP、LINUX 平台 的 roseHA， 而 通常 DBA 不 是 系统 
管理 员 ， 对 操作 系统 方面 的 技能 未 必 有 那么 过 硬 。DB2 pureScale 就 不 同 了 ， 它 本 身 就 具有 高 可 
用 性 ， 这 样 就 无 须 DBA 再 去 额外 配置 和 管理 了 。 

其 次 ， 单 节点 DB2 数据 库 ， 实 现 扩展 性 也 是 个 难题 。 我 见 过 一 些 生产 系统 ， 刚 开始 是 一 个 
数据 库 ， 后 来 随 着 用 户 量 和 访问 量 的 增加 ， 单 节点 数据 库 、 单 台 服 务 器 过 到 性 能 瓶 贷 了 ， 开 始 
扩展 到 多 个 数据 库 ， 用 多 个 数据 库 来 承载 不 同 用 户 或 者 不 同 应 用 的 访问 ， 也 就 是 通常 说 的 “应 
用 分 库 ” 方 案 。 那 么 ， 这 些 个 数据 库 之 间 如 果 要 共享 数据 怎么 办 ? 那 就 只 能 使 用 数据 库 复 制 技 
术 了 。DB2 pureScale 本 号 提供 的 扩展 性 使 得 上 述 问题 不 存在 了 ， 随 着 用户 量 和 访问 量 的 提高 ， 
MP ERREALA, IADE. 

最 后 ， 单 节点 DB2 数据 库 实现 负载 均衡 更 不 容易 。 例 如 ， 在 上 面 的 “应 用 分 库 ” 方 案 中 ， 
需要 应 用 根据 用 户 名 将 查询 或 者 事务 分 发 给 多 个 数据 库 ， 也 就 是 负载 均衡 逻辑 是 由 应 用 来 控制 


的 ， 数 据 库 只 是 作为 数据 存储 功能 而 已 。 这 对 DB2 pureScale 来 说 是 很 容易 实现 的 ， 其 提供 的 
工作 负载 均衡 能 力 是 非常 强大 的 。 


IN 注意 : DB2 pureScale RAH ZEEZ 
DB2 pureScale 作为 集 集群 数据 库 ， 除了 也 有 自身 的 复杂 度 。 
举 个 简单 的 例子 ， 一 个 DBA 配置 和 监控 单 节点 单 分 区 的 DB2， 明 显要 比 配 置 和 监控 4 
个 成 员 、2 个 CF 节点 的 DB2 集群 要 容易 得 多 。 那么 如 果 是 16 个 成 员 、2 CF 节点 呢 ? 


AY TE] Ade e dM aU i LN 一 些 实用 命令 (以 mydb 数据 库 为 
例 ) ， 包 括 管理 命令 、 维 护 命令 和 监控 命令 ， 硕 望 能 起 到 抛砖引玉 的 作用 。 


11.4.1 Hg EBD 


.数据 库 激活 /去 激活 命令 
激活 数据 库 : 

activate database mydb 
去 激活 数据 库 : 

deactivate database mydb 


去 激活 成 员 2 上 的 数据 库 : 


deactivate database mydb member 2 
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2. DB CFG 参数 配置 命令 


在 当前 成 员 的 机 器 上 执行 下 述 命令 ， 获 得 当前 成 员 的 DB CFG fils: 
ger dlo etg iror myelo 


修改 成 员 0 上 的 DB CFG 配置 参数 : 


update db cfg for mydb member 0 using «parameter name» «parameter value> 
修改 DB CFG 配置 参数 ， 应 用 到 集群 所 有 成 员 : 

update db cfg for mydb using <parameter name> <parameter value> 

3. CF 管理 命令 

司 动 ID 为 129 的 CEF TA: 


dbz start T CHRO 


停止 ID X 129 的 CF 节点 : 


clo eec CF 129 


局 动 编号 为 0 的 成 员 市 点 : 


db2start member 0 
停止 成 员 0: 
db2stop member 0 


这 时 ， 可 以 从 sysibmadm.db2 member ££ EL FB EAS, Bo 0 已 停止 


Sle Lal, 


varchar (HOME HOST, 10) as home nost, 
varchar (current host, 10) as cur Nost, 
varchar(state, 21) as state, 

alert 


from sysibmadm.db2 member 


LD HOME HOST CUR HOST STATE ALERT 
0 NODE101 NODE101 STOPPED NO 
1 NODE102 NODE102 STARTED NO 
2 record(s) selected. 


5. 改变 实例 中 成 员 顺 序 


按照 下 面 的 命令 ， 首 先 使 用 db2cluster 命令 的 “-delete-resources” 删 除 资源 ， 随 后 编辑 
db2nodes.cfg， 调 整 成 员 顺 序 ， 最 后 再 用 “-create-resources ”重建 资源 。 命 令 如 下 : 
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db2cluster -cm -delete -resources 
DB2 instance resources have been successfully deleted. 
// 编 辑 do2nodes.cfg, EE XE HER ra JL FE 


db2cluster -cm -create -resources 


All cluster configurations have been completed successfully. db2cluster exiting ... 


++ EIE 4A 
11.4.2. TREIME 
1. 维护 某 个 成 员 命令 
暂停 编号 为 1 的 成 员 市 点 : 
db2stop member 1 quiesce 


停止 node102 上 的 DB2 实例 ， 执 行 维护 ， 例 如 升级 操作 系统 补丁 : 


db2stop instance on nodel102 


完成 维护 后 ， 重 启 nodel02 上 的 DB2 实例 和 成 员 : 


db2start instance on nodelO02 
db2start member 1 


2. 维护 邓 个 主机 命令 


首先 停止 该 主机 上 访问 GPFS 文件 系统 的 所 有 进程 ， 随 后 停止 该 主机 上 所 有 DB2 实例 ,最 
后 执行 下 面 的 命令 : 


db2cluster -cm -enter -maintenance 


db2cluster -cfs -enter -maintenance 


退出 维护 状态 ， 在 该 主机 上 执行 下 面 的 命令 : 


db2cluster -cm -exit -maintenance 


db2cluster -cfs -exit -maintenance 
3. 替换 CF 节点 命令 
停止 ID Jj 128 的 CF 节点 : 


dio2 stop CF 128 


停止 该 CF T AITE EDL SE BU : 


db2stop instance on nodel01 


从 集群 中 删除 该 CF 节点 : 


dio2 iupdete cole ree -cf nocello doboz2sdini 


向 集群 中 添加 新 的 CF 节点 ，ID 为 129: 


dio2 iupdt -ade = 一 CE aree teli ol ee 
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EAIA KI CF IH is 


cic st gp m9 


mR 


11.4.3 GPFS 文件 系统 管理 命令 


1. 启动 GPFS 集群 


QB om /oeE /TEM VI EE I 0 Imre er Ct to orl 


All specified hosts have been started successfully. 
2. 停止 GPFS 集群 


四 
All specified hosts have been stopped successfully. 


3. 列 出 当前 GPFS 集群 状态 
do2m0:/ Tnmlscluster 


(PROS cluster infrormacLon 


CEE S eds Ue Sou olo cbe cmo 0 0 2s Sd ml 
GPFS cluster id: 1239843916596041 9547 

GPFS UID domain: Aore luor ml 
Remote shell command: /usr/bin/ssh 


Remote file copy command: /usr/bin/scp 


GPES Cluster configuration servers. 


Primary server: db2member1 


Secondary server: db2CF1 


Node Daemon node name IP address Admin node name Designation 
1 db2member1 172.16.50.12 db2member1 quorum-manager 
2 clo2ef 1 172.16.50.16 clo2ef 1 quorum-manager 
3 52GEU quA cc mU Go52GEU quorum-manager 
4 db2memberO0 172.16.50.11 db2memberO quorum-manager 


4. 删除 GPFS 集群 


loyal) ope TEM dap VETE SETUP TED e S S CIE um /dD ol Er etes sr cxele dies ex domaun 
do 2e Ine ter OOo 1 > 50 ml 
Delee rm em Om ol er 0 nn OMe EC 


5. 创建 文件 系统 
例如 ， 下 和 面 的 命令 创建 了 文件 系统 db2test。 


ee 
Eee 


File system 'db2test' has been successfully created. 


6. 列 出 文件 系统 所 在 的 磁盘 
例如 ， 下 面 的 命令 列 出 了 文件 系统 db2test 所 在 的 磁盘 为 /dev/hdisk30。 
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do2m0s/ > do2eceluster =efs =list =filesystem do2trest =disk 
PATH ON LOCAL HOST OTHER KNOWN PATHS 


/dev/hdisk30 


7. 删除 GPFS 文件 系统 


例如 ， 下 面 的 命令 删除 了 文件 系统 db2test. 


demon eros TEM oec Jw EQ o LISTE Lo mre cxsdeswst eu! cles est 
File system 'db2test' has been successfully deleted. 


8. 挂 载 GPFS 文件 系统 


例如 ， 下 面 的 命令 挂 载 文件 系统 db2test， 默 认 挂 载 路 径 为 /db2fs/db2test。 


OP mO Ore TEM ap VOTERT o ean o e eer a En 
S Ee 


File system 'db2test' was successfully mounted. 


9. 卸载 GPFS 文件 系统 


例如 ， 下 面 的 命令 翻 载 文件 系统 db2test。 


doo mo ee 


File system 'db2test' was successfully unmounted. 


10. 列 出 当前 集群 中 文件 系统 


如 下 所 示 , 在 当前 GPFS 集群 中 , 有 db2data. db21og0. db2logl. db21og2. db21og3 和 db2test 


等 文件 系统 。 
do2m0 s /do2trest >db2cluster =efs =list =filesystem 
FILE SYSTEM NAME MOUNT POINT 
db2backup /db2fs/db2backup 
db2data /db2data 
db2fs1 Vo 12 (0L 0o) 2162 250 S 
db210g0 /db210og/NODE0000/LOGSTREAMOO000 
eol / db210g/NODE0000/LOGSTREAMOO01 
el ee > / db210g/NODE0000/LOGSTREAMOO02 
dio2 Logs /db2log/NODE0000/LOGSTREAM0003 
db2test OPAS 


A AS AN 
mHBD e 


11.4.4 上 监 


T 
cu 


1. 检测 主机 状态 


使 用 下 面 的 命令 获取 主机 状态 ， 其 中 NODE101 为 活动 (ACTIVE) 状态 ，NODE102 为 非 
活动 (INACTIVE ) 状态 : 


select varchar (nostname, 10) as host, Eee Eee 8) as state, ace aug SEE Ye 
stopped, 7) @as stopped, alert from sysibmacm.Clo2 Cluster host state 
NOST state stopped alert 
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NODE101 ACTIVE NO NO 
NODE102 INACTIVE NO YES 


2 record(s) selected. 


2. 检测 成 员 状 态 


使 用 下 面 的 命令 获取 成 员 状 态 ， 其 中 运行 在 NODE101 上 的 成 员 处 于 已 启动 (STARTED) 
状态 ， 运 行 在 NODE102 上 的 成 员 处 于 恢复 等 待 (WAITING FOR FAILBACKO 状态 : 


select icd, varchar (state, 21) as state, yvarchar (nome nost, 10) as nome NOSE, 


var ehar (Current host Oas a hoe a ee Eeron ea a aae o S Member 


Se om es cur nost alert 
STARTED NODE101 NODE101 NO 
WAITING FOR FAILBACK NODE102 NODE102 YES 


2 record(s) selected. 


3. 检测 CF 状态 


使 用 下 面 的 命令 获取 CF 状态 ， 其 中 ID 为 128 的 CF 节点 处 于 正在 唤醒 CCATCHUP) 状 
态 ，ID 为 129 的 CF 节点 显示 为 主 节 点 (PRIMARY) : 


select ic, yvyarchar (state, 17) as state, yvarchar (home host, 10) as nome NOSE, 
varchar (current host, 10) as cur host, alert from 


TABLE (clo2 get instance info(NULL; "Yp" "p YCE" , NULL) } 


id Sae home host Cur NOST alert 
128 CATCHUP (85%) NODE101 NODE101 NO 
129 PRIMARY NODE102 NOD3102 NO 


2 record(s) selected. 


4. 监控 CF 节点 全 局 缓冲 池 


使 用 下 面 的 监控 命令 ， 获 得 CF 节操 的 全 局 绥 存 信息 ， 例 如 ID 为 128 的 CF 市 点 当前 全 局 

绥 冲 池 的 大 小 (current cf gbp size) 为 2014 个 4K 页面， 已 配置 的 全 局 缓冲 池 大 小 

(configured cf gbp_size) 为 142336 个 4K 页 面 ,目标 全 局 缕 冲 池 (target_cf gbp_size) 为 142336 
A AK 页面 : 


Se 


contigured cert gop size, target ct gop T cM omar cf (NULL) } 


host Mosti current et gop size Contigureci cet gop size target ct gop size 


nodel01 128 2014 142336 142336 
nodel02 129 2248 142336 142336 


2 record(s) selected. 


5. 监控 CF 市 点 锁 内 存 


使 用 下 面 的 监控 命令 ， 获 得 CF 市 点 的 锁 内 存 信 息 ， 例 如 ID 为 128 的 CF 节点 当前 锁 内 存 
大 小 (current cf lock size) 为 133852 个 AK 页 面 ,已 配置 的 锁 内 存 大 小 Cconfigured cf lock size? 
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为 564224 个 AK 页 面 ， 目 标 锁 内 存 大 小 Ctarget cf lock size) 为 564224 个 4K 页 面 : 


aoee e = 


contigured erf lock size, target cf lock size from cable (mon get crt (NULL) M 
es 


NODE101 128 133852 564224 564224 
NODE102 129 133852 564224 564224 


2 record(s) selected. 


6. 监控 成 员 市 点 缓冲 池 


使 用 下 面 的 监控 命令 ， 从 表 函 数 MON GET BUFFERPOOL 中 获取 结果 。 其 中 成 员 0 的 命 
中 率 为 98.19%， 成 员工 的 命中 率 为 98.1396: 


select bp name, member, POOL DATA GBP L READS+POOL INDEX GBP L READS AS 
LOGICAL READS, 

POOL DATA GBP P READS+POOL INDEX GBP P READS AS PHYSICAL READS, 

((FLOAT(POOL DATA GBP L READS+POOL INDEX GBP L READS) 
-FLOAT(POOL DATA GBP P READS+POOL INDEX GBP P READS))/FLOAT(POOL DATA GBP L READS+POO 
L INDEX GBP L READS)) 

* 100 AS HIT RATIO FROM TABLE (MON GET BUFFERPOOL('',-2)) WHERE BP NAME-'IBMDEFAULTBP' 


BP NAME MEMBER LOGICAL READS Epi SS PEERS HIT RATIO 
IBMDEFAULTBP 1 191509 3569 98.13 
IBMDEFAULTBP 0 189314 3419 98.19 


2 record(s) selected. 


7. 监控 CF PABI CPU 利用 率 


*. 


使 用 下 面 的 监控 命令 , 分 别 获 取 运 行 两 个 CF 节点 所 在 的 NODE101 4I NODEI02 两 台 主 机 
的 CPU 利用 率 ， 其 中 NODE101 为 96%6，NODE102 7j 9795. 


select varchar (name, 20) as host attribute, varchar (value, 25) as values, 


varchar (unit, 8) as unit trom sysibmacm. eny Cf SyS resources 


NOSE UT SN value unit 
HOST_NAME NODE101 E 
MEMORY TOTAL 24108 MB 
MEMORY PREE 3504 MB 
MEMORY SWAP TOTAL410 2 MB 
MEMORY SWAP FREE 4063 MB 
MEMORY MEM TOTAL 28211 MB 
MEMORY MEM EREE 1568 MB 
Ceu UA E TOTAL 96 PERCENT 
HOST_NAME NODE102 E 
MEMORY TOTAL 24108 MB 
MEMORY PREE 3342 MB 
MEMORY SWAP TOTAL4102 MB 
MEMORY SWAP FREE 4063 MB 
MEMORY MEM TOTAL 26211 MB 
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MEMORY MEM FREE 7406 MB 
CIBUS SCRI, 97 PERCENT 


16 record(s) selected. 


. 快速 查看 各 个 组 件 状态 


DBA 也 可 以 使 用 db2instance 命令 快速 查看 集群 中 各 个 组 件 的 状态 ， 从 下 面 可 以 看 出 ， 集 
群 中 有 2 个 成 员 节 点 都 处 于 活动 状态 ; 另外 还 有 2 个 CF 节点 ， 一 个 为 主 节 点 ， 一 个 为 从 节点 : 


db2instance -list 
TID m STATE HOME HOST CURRENT HOST ALERT PARTITION NUMBER BOCAR NETNAME 


0 MEMBER STARTED nodel101 node101 NO 0 0 node101 
1 MEMBER STARTED node102 node102 NO 0 0 node102 
128 CE PRIMARY node1l01 nodel101 NO = 0 node101 
129 CF PEER nodel102 node102 NO 一 0 nodel102 
HOSTNAME STATE INSTANCE STOPPED ALERT 

node101 ACTIVE NO NO 

node102 ACTIVE NO NO 


11.5 DB2 pureScale 规划 总 结 


DB2 pureScale 集群 数据 库 在 DB2 发 展 中 具有 里 程 碑 的 意义 ， 它 满足 了 关键 应 用 对 高 可 用 

TE. < 那么 DBA 在 具体 的 规划 和 实施 中 需要 注意 什么 呢 ? 这 里 ， 
2j 笔者 在 为 客户 做 咨询 或 者 实施 过 程 中 的 经 验 : 

(1) 需要 儿 台 服务 器 ? 至少 需 要 2 台 机 器 ， 这 样 可 以 防止 出 现 单 点 故障 。 一 个 典型 的 Power 

平台 上 的 DB2 pureScale 集群 包括 2-4 台 服 务 器 ， 上 和 面 创建 有 多 个 AIX 分 区 (LPAR) ， 每 个 分 


区 运行 CF 或 成 员 ; 一 个 典型 的 x86 平台 上 的 DB2 pureScale 集群 包括 4-6 台 服 务 器 ， 每 个 机 器 
T CF 或 成 员 。 


(2) 人 硬件 选择 Power 平台 还 是 X86 平台 ?这 个 要 根据 具体 应 用 来 定 ，ERP、 银 行 交 易 等 
关键 性 负载 应 该 选择 Power 平台 ; 对 一 些 只 是 需要 珊 可 用 性 的 普通 人 负载， 可 以 选择 义 86 平台 。 

(3) 如 何 选 择 Power 机 器 型 号 ?在 Power 平台 上 ， 可 以 根据 需要 ， 选 择 Power 6 中 的 550 
和 595; 也 可 以 选择 Power 7 中 的 全 系列 ， 包 括 710. 720. 730. 740. 750. 770. 780 和 795. 

(4) 如 何 选 择 X86 机 器 型 号 ? 目前 X86 平台 可 供 选 择 的 机 器 型 写 只 有 3650 M3、3690 X5 
和 3850 X5. 

(5) 如 何 选择 存储 型 号 ?只 要 文 持 GPFS 的 型 号 就 可 以 ， 为 了 文 持 失 效 成 员 的 IO 隔离 ， 
存储 要 求 最 好 文 持 SCSI-3 持久 保护 。 

(6) 如 何 选 择 网 络 ? 除 了 Infiniband 网 络 外 ， 从 DB2 VIO 开始 文 持 万 兆 以 太 网 。 对 网 络 
带宽 有 很 高 要 求 的 场景 下 ， 选 择 Infiniband 网 络 ， 反 之 ， 如 果 各 个 成 员 之 间 内 部 互联 的 带宽 要 
求 不 高 ， 可 以 考虑 万 兆 以 太 网 。 

CL) 如 何 规 划 CF? 一 个 物理 机 或 者 一 个 AIX 分 区 (LPAR) 上 运行 一 个 CFE， 需 要 规划 2 
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个 ， 一 个 为 主 ， 另 一 个 为 从 ， 这 样 可 以 避免 出 现 单 点 故障 。 运 行 每 个 CF 的 CPU 最 大 内 核 数 取 
AFAR, 如果 是 写 频繁 负载 , 通常 成 员 内 核 数 和 CF 内 核 数 的 比例 为 6:1, 如 果 是 读 频 繁 负载 ， 
这 个 比例 为 10:1。 写 频繁 程度 越 高 ， 运 行 每 个 CF 需要 的 内 存量 就 越 大 。 
(8) 如 何 规 划 成 员 ? 一 个 物理 机 或 者 一 个 AIX 分 区 (LPAR) 上 运行 一 个 成 员 ， 后 续 可 以 

根据 需要 扩充 成 员 的 个 数 。 运行 每 个 成 员 的 CPU 最 大 内 核 数 取决 于 负载 的 需求 ,运行 每 个 成 员 
的 内 存量 通常 为 每 个 内 核 4G~8G 内 存 。 

(9) 如 何 规划 存储 ? 存储 分 为 两 部 分 ， 一 部 分 是 一 个 仲裁 盘 ， 容 量 为 25MB 以 上 ; 为 一 
BEREA, 用 来 存放 GPFS 文件 系统 , 其 中 需要 一 个 实例 共享 文件 系统 ,容量 为 2GB 以 上 ， 
[ 余 文 件 系 统 用 来 存放 数据 和 日 志 。 
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入 到 开放 平台 。 通 过 对 便 件 和 网 络 的 充分 利用 ， 提 高 了 并 发 性 并 显著 降低 了 开销 ， 从 而 提供 了 
更 高 的 扩展 能 

本 章 首 先 介 绍 了 DB2 pureScale 架构 ， 并 和 Oracle RAC 进行 了 对 比 。 随 后 通过 某 银 行 DB2 
pureScale 实战 案例 ， 同 读者 介绍 了 在 Power 平台 上 的 规划 和 部 署 。 最 后 ， 为 了 方便 读者， 提供 
了 DB2 pureScale 第 用 运 维 命令 和 规划 总 结 。 


本 书 的 写作 , 我 们 是 从 2012 年 1 月 1 日 正式 动笔 的 , 一 直 持 续 到 2013 年 5 月 1 日 才 封 笔 ， 
总 共 持 续 了 480 Ko 洋洋 酒 酒 500 多 页 将 近 50 万 字 的 内 容 , 现在 终于 和 广大 读者 见面 了 。 要 谈 
起 中 间 的 写作 感受 ， 了 驶 如 同 唐僧 师 徒 四 人 赴 西 天 取经 一 般 ， 一 路 草 环 丛生， 历尽 千 溯 万 苦 、 九 
九 八 十 一 难 终于 取得 了 真 经 。 我 这 里 不 想 讲 在 这 本 书 上 夜以继日 的 写作 ， 牺 牲 掉 了 与 家 人 、 朋 
友 聚 会 的 时 间 ; 我 也 不 想 讲 这 本 书 经 过 几 十 次 的 版 本 修订 ， 上 百 次 的 会 议 讨 论 。 我 觉得 这 些 都 
很 正常 ， 这 是 写作 中 必须 付出 的 投入 ， 并 没有 值得 大 讲 特 讲 的 。 我 这 里 想 讲 的 是 这 本 书 的 萌发 
点 ， 实 际 上 是 从 自己 内 心 深 处 的 某 种 信念 开始 的 。 

2011 年 ， 我 儿 乎 满 世界 用 了 近 一 年 ， 过 的 是 客户 、 公 司 和 家 庭 三 点 一 线 的 生活 。 做 的 事 非 
常 有 挑战 性 ， 其 重点 驶 是 帮助 IBM 公司 四 处 灭火 ， 做 了 大 量 数据 库 迁 移 、 故 隐 诊 断 和 性 能 优化 
工作 , 也 给 IBM 的 客户 和 合作 伙伴 做 过 大 量 的 培训 和 技术 交流 。 这 样 一 来 在 业界 和 公司 内 部 的 
名 气 也 逐渐 建立 起 来 了 。 面 对 成 绩 ， 我 反复 告诫 自己 ， 一 定 要 肪 得 住 诱 惑 ， 附 得 住 彼 实 ， 保 持 
一 箱 平 第 心 。 

忙碌 之 余 ， 有 时 候 静 下 心 来 ， 会 反问 自己 ， 到 底 想 要 什么 ? 其 实 ， 这 些 年 来 ， 我 内 心 深 处 
一 直 有 个 想法 ， 那 就 是 能 为 广大 数据 库 工 作者 编写 一 本 好 书 。 这 个 想法 ， 从 我 刚 加 入 BM 公司 
的 时 候 就 有 了 。 从 那 时 起 ， 我 阅读 了 大 量 的 数据 库 经 典 闭 作 ， 汲 取 了 大 量 的 技术 营养 ， 从 内 心 
期 望 要 是 有 一 天 自己 能 写 出 这 样 的 经 典 之 作 该 多 好 啊 ， 但 由 于 工作 非常 忙碌 抽 不 出 写作 时 间 而 
ER. EEH, 2| 2011 年 的 时 候 ， 我 已 经 在 数据 库 这 个 领域 摸 让 深 打 了 多 年 ， 最 难 打 交道 
的 客户 都 打 过 交道 了 ,最 难 相 处 的 合作 伙伴 也 都 合作 过 了 ， 最 难 优化 的 DB2 性 能 问题 也 都 解决 
过 了 ， 动 笔 的 条 件 已经 基本 成 熟 了 。 尽 管 还 能 为 自己 找 一 些 理由 ， 比 如 没有 时 间 ， 比 如 技术 和 
经 验 还 需要 再 积累 , 但 是 IT 行业 发 展 太 快 ， 等 到 什么 都 准备 好 的 时 候 ， 也 许 掌 握 的 技术 和 经 验 
已 经 过 时 了 。 此 时 不 动笔 ， 更 符 何 时 ! 

有 了 动笔 的 想法 还 没有 付 诸 实施 ， 但 是 诱惑 来 的 更 快 。2011 年 12 月 25 日 ， 在 数据 库 领 域 
一 家 最 有 实力 的 公司 多 次 通过 猪头 公司 诚意 邀请 我 加 盟 , 不仅 为 我 开 出 了 非常 有 吸引 力 的 薪酬 ， 
而 且 给 我 提供 了 很 好 的 位 置 ， 可 以 让 我 独 挡 一 面 ， 发 挥 自 己 所 长 。 这 是 一 个 千载难逢 的 好 机 会 。 
摆 在 我 面前 的 是 两 条 路 ， 一 条 路 是 选择 这 家 最 有 实力 的 数据 库 公 司 ， 获 得 好 的 发 展 机 会 和 优厚 
竺 遇 ， 这 条 路 没有 悬念 ， 是 条 宽广 之 路 ， 前 途 看 好 ， 但 是 由 于 公司 之 间 侧 重 领域 不 同 ， 编 写 一 
本 DB2 方面 的 经 典 之 作 束 不 可 能 了 ; 另外 一 条 路 是 放弃 眼前 的 这 个 机 会 ,而 去 实现 自己 内 心 深 
处 多 年 的 想法 ， 把 自己 的 优化 实战 经 验 和 培训 经 验 分 享 出 来 ， 通 过 书籍 的 方式 帮助 广大 DBA 
掌握 DB2 设计 和 性 能 优化 技术 ， 让 他 们 少 走 弯路 ， 让 他 们 体会 到 学 习 数据 库 技 术 的 快乐 。 

记得 曾经 在 一 本 书 上 看 到 过 这 样 的 话 : “人 生 既 要 追求 职业 的 成 功 ， 也 要 注意 内 在 心灵 的 
成 长 与 提升 ， 才 能 保持 内 心 的 平衡 、 满 足 和 愉悦 ”。 经 过 几 天 的 入 很 ， 我 最 终 义 无 反 顾 地 放弃 
Tak UXuEHhICRET SSR TETEL LATHER JET: 


后 记 ”信念 的 奇迹 2 


能 为 中 国 广大 DBA 们 写本 好 书 ， 一 直 是 我 的 信念 。 所 谓 信 念 ， 婚 是 心中 的 一 文火 把 ， 它 
能 最 大 限度 地 燃烧 一 个 人 的 潜能 , 指引 其 飞 癌 梦想 的 天 空 。 我 从 不 相信 运气 可 以 文 配 个 人 命运 ， 
我 从 不 指望 有 什么 奇迹 ， 只 要 心中 信念 的 火把 不 曾 烛 灭 ， 即 使 道路 再 师 虹 难 行 ， 前 途 也 是 一 片 
光明 ， 也 一 定 可 以 创造 信念 的 奇迹 。 
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4n 略语 


Archive Log“〈 归 档 日 志 ) 


DB2 日 志 系 统 的 一 种 工作 模式 。 当 最 后 一 个 日 志文 件 写 满 时 ， 会 创建 一 个 新 的 日 志文 件 ， 
这 样 将 来 的 事务 束 不 会 履 兰 现 有 的 日 六 文件 。 

Backup (#4) 

数据 库 备 份 就 是 将 数据 库 中 所 有 数据 存储 为 一 个 数据 副本 ， 供 数据 库 出 现 问题 时 恢复 使 用 。 

BCU (Balanced Configuration Unit) 


BCU 是 指 把 处 理 器 、 内 存 、 存 储 、 分 区 、 配 置 参数 等 结合 在 一 起 ， 作 为 一 个 可 扩展 的 基 
本 单元 。 它 是 最 小 的 、 可 复制 的 软 硬 件 组 合 。 针 对 数据 仓库 系统 ，BCU 保证 了 基础 架构 上 的 扩 
展 性 ， 提 供 了 人 磁盘、 内 存 、 人 处理 器 、 网 络 的 优异 扩展 性 能 。 

Bind 〈 绑 定 ) 


DB2 为 应 用 程序 的 一 个 或 多 个 SQL 生成 得 询 访问 计划 ， 同 时 将 其 和 应 用 程序 关联 起 来 的 


BPU (Balanced Partition Unit) 


BPU 是 一 个 多 和 辑 概念 ， 是 指 服务 于 一 个 DB2 数据 库 分 区 所 需 的 一 组 相关 功能 和 相关 系统 


Bufferpool (缓冲 池 ) 


绥 冲 池 是 内 存 中 的 一 块 存储 区 域 ， 用 于 临时 读 入 和 更 改 数据 库 页 (包含 表 行 或 索引 项 )。 
绥 剖 池 的 用 途 是 为 了 提高 数据 库 系 统 的 性 能 。 
Circular Log (循环 日 志 


人 循环 日 志 是 DB2 缺 省 的 日 志 工 作 模 式 。 在 循环 日 志 中 , 一 旦 日 记 目 录 中 最 后 一 个 主 日 记 文 
件 人 被 写 满 了 ， 束 会 循环 写 入 ， 将 狐 的 事务 写 到 第 一 个 日 志文 件 中 ， 从 而 履 庆 现 有 的 日 志 数 据 。 


ria nm 


Container CZ: z3) 


容 右 是 存放 数据 的 文件 或 设备 ， 一 个 容器 只 能 被 单独 的 表 空 间 使 用 。 
Currently Committed (当前 已 落实 ) 


从 DB2 V9.7 开始 ， 一 种 针对 游标 稳定 性 (Cursor Stability) 隔离 级 别 的 特性 。 当 读 事务 和 
瑟 事 务 冲 突 时 ， 读 事务 不 会 补 阻 塞 ， 而 是 从 日 志 绥 冲 区 或 者 活动 日 志文 件 中 访问 冲突 行 的 “ 当 
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前 已 落实 ”上 版本， 这样 就 提高 了 数据 库 的 并 发 能 力 。 
Cursor 游标) 


本 质 上 ， 游 标 是 一 种 能 从 包括 多 条 数据 记录 的 结 采 集中 每 次 提取 一 条 记录 的 机 制 。 游 标 总 
是 与 一 条 SQL 但 询 语 句 相 关联 ， 并 指 问 返回 的 结果 集 。 通 过 游标 ， 可 以 从 这 个 结果 集中 每 次 
提取 一 条 记录 。 

Data Warehouse 数据 仓库 ) 

数据 仓库 就 是 面 问 主题 的 、 集 成 的 、 稳 定 的 《不 可 更 新 ) 、 随 时 间 变 化 《不 同时 间 ) 的 数 
据 集 合 ， 它 可 用 以 文 持 经 营 管理 中 的 决策 制定 过 程 。 

Dead Lock (Jeh) 


VÀ A Bk 5H Ze SE ASOGE BILE JI PS PH, WAIE. 
DMS (Database Managed Space) 


2i FE^ BEXeTRIH, 由 DB2 ELBZEE e ^ [RI BRI E HH, RES BS ae TRI d n] EA Xe SC TE IR E 
或 者 保 设 备 。 
DPF (Database Partitioning Feature) 


数据 库 分 区 功能 ,一 种 DB2 的 分 区 模式 。 这 种 分 区 模式 采用 Share-Nothing 非 共 享 体系 结 
构 。 数 据 库 在 一 个 非 共 部 的 环境 中 被 分 解 为 独立 的 分 区 ， 每 个 分 区 都 上 共有 目 己 的 资源 。 

EDU (Engine Dispatchable Units) 

DB2 中 执行 特定 任务 的 线程 ， 分 为 实例 级 、 应 用 级 和 数据 库 级 EDU. 

ETL CExtract-Transform-Load?) 

来 源 复杂 的 操作 型 数据 进入 数据 仓库 之 前 ， 进 行 的 抽取 、 转 换 和 加 载 过 程 。ETL 的 基本 流 
程 是 ， 通 过 消除 来 目 不 同 数据 源 数 据 的 不 一 致 之 处 、 以 保证 数据 仓库 内 的 信息 一 致 性 。 

Event Monitor (事件 监视 器 ) 

事件 监控 器 收集 特定 事件 发 生 时 的 监控 数据 ， 例 如 当 一 个 连接 到 数据 库 的 应 用 程序 断 开 
时 、 事 务 提交 时 、SQL 语句 执行 完成 时 或 者 死 锁 发 生 时 等 。 事 件 监视 器 必须 由 用 户 创建 ， 而 且 
可 以 手动 地 打开 和 关闭 。 一 旦 打开 后 ， 事 件 监视 器 会 不 断 捕 获 相 关 事 件 的 信息 。 

Explain Tool (解释 工具 ) 


但 看 访问 计划 和 相关 信息 的 DB2 工具 ， 可 用 于 收集 、 输 出 和 显示 访问 计划 以 及 DB2 生成 
访问 计划 时 所 依据 的 各 种 信息 。 
HADR (High Availability Disaster Recovery) 


DB2 局 可 用 性 灾难 恢复 (HADR) 提供 了 一 种 高 可 用 和 灾难 恢复 解决 方案 。 


DB2 设计 、 管 理 与 性 能 优化 艺术 


Index (R51) 


索引 是 为 了 快速 公 找 数据 而 设计 的 特殊 数据 结构 。 罕 引 的 优势 主要 表现 在 三 方面 。 首 先 ， 
为 表 中 被 请 求 的 数据 行 提供 下 接 指 针 ; 其次， 避免 了 排序 操作 ; 第 三 ， 避免 了 对 数据 表 的 访问 。 
但 索引 并 不 是 越 多 越 好 ， 因 为 在 插入 、 更 新 和 删除 时 需要 额外 索引 维护 开销 。 


Isolation Level (隔离 级 别 ) 


在 多 用 户 并 发 环境 下 ， 多 个 事务 第 第 同时 执行 ， 但 是 每 个 事务 都 有 可 能 与 其 他 正在 运行 的 
事务 发 生 冲 突 。 数 据 库 的 隔离 级 别 ， 是 为 了 保证 同时 运行 的 事务 具有 一 致 的 运行 结果 。DB2 x 
持 四 种 隔离 级 别 ， 分 别 是 可 重复 读 C(Repeatable Read) 、 读 稳定 性 (Read Stability) 、 游 标 稳 
定性 (Cursor Stability) 和 未 提交 的 谈 〈Uncommitted Read) 。 


Instance (实例 ) 


实例 是 DB2 架构 中 最 上 层 的 对 象 ， 对 于 一 个 数据 库 安装 ,我们 可 以 创建 多 个 实例 。 实 例 并 
不 直接 和 数据 打交道 ， 它 为 数据 库 正 常 运转 提 供 了 各 种 必要 的 基础 设施 ， 在 创建 数据 库 之 前 ， 
需要 先 创建 实例 。 

LBAC (Label Based Access Control) 


基于 标签 的 访问 控制 ， 它 允许 以 细 粒 度 控制 谁 有 权 访 问 单独 的 行 或 列 。 

LOB (Large Object 

大 对 象 ,， DB2 中 一 类 数据 类 型 ， 具 体 包 括 BLOB 和 CLOB 两 种 数据 类 型 。 可 以 用 于 存储 较 
大 的 数据 对 象 ， 最 大 可 以 为 2G。 

Lock Escalation ( 锁 升 级 ) 

在 锁 资 源 耗 尽 后 , DB2 会 试图 把 儿 个 行 级 别 的 锁 合 并 为 一 个 表 级 别 的 锁 , 从 而 释放 锁 空 间 ， 
这 种 现象 称 为 锁 升 级 。 

Lock Wait〈 锁 等 待 ) 

当 一 个 事务 在 特定 数据 (例如 表 或 行 ) 上 持 有 锁 时 ,其 他 事务 对 该 资源 的 访问 都会 被 拒绝 。 
如 果 没 有 某 种 锁 超 时 检测 机 制 ， 则 事务 可 能 无 限期 地 等 竺 锁 的 释放 ， 这 种 情况 瓯 叫 锁 等 竺 。 

Lock Timeout 〈 锁 超时 ) 


发 生 锁 等 每 时 ， 为 了 防止 请 求 锁 的 应 用 程序 无 限期 等 每 ，DB2 提供 了 LOCKTIMEOUT 数 
据 库 参 数 。 这 样 ， 当 锁 等 待 的 时 间 超 过 这 个 参数 的 设 定 值 ， 束 会 触发 锁 超时 事件 ， 并 回 深 事 务 。 
MDC (MultiDimensional Clustering) 


多 维 群 集 , 一 种 数据 存储 方式 , 它 使 数据 在 多 个 维度 上 有 灵活、 连续 和 目 动 的 聚合 。 通 过 MDC, 
可 以 提升 得 询 的 性 能 ， 并 且 减 少 了 在 插入 、 更 新 和 删除 期 间 对 REORG 和 索引 维护 的 需要 


MPP C(MassiveParallel Processing) 


o 


多 机 并 行 处 理 ， 狭 义 上 是 DPF 模式 的 别称 。 
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MQT (Materialized Query Table) 


物化 得 询 表 ， 一 种 将 奉 询 结 末 存储 起 来 的 物化 表 ， 用 于 提高 复杂 答 询 的 效率 。 每 当 MQT 
所 基于 的 但 询 被 引用 时 ， 数 据 库 将 直接 从 MQT 的 物理 存储 中 得 到 奋 询 纤 
OLAP (Online Analysis Processing) 


联机 在 线 分 析 处 理 ， 数 据 库 负 载 尖 型 乙 一 ， 以 并 发 事务 较 少 、 奉 询 语句 非常 复杂 、 数 据 更 
新 较 少 、 数 据 量 庞大 为 特征 。 

OLTP (Online Transaction Processing) 

联机 在 线 事务 处 理 ， 数 据 库 负载 类 型 之 一 ， 以 大 量 事务 并 发 进行 、 奉 询 语 句 简单 、 数 据 更 
狐 操 作 频 器 为 特征 。 

Optimizer 〈 优 化 器 ) 


优化 器 是 用 来 产生 访问 计划 的 组 件 , 一 个 SQL 要 以 最 优 性 能 运行 , 有赖 于 优化 器 产生 最 优 
的 访问 计划 。 
Package (程序 包 ) 


程序 包 是 一 个 存储 过 程 、 静 态 SQL 语句 或 者 UDF 编译 后 生成 的 可 执行 二 进 制 代 码 。 当 一 
个 存储 过 程 被 编译 时 ， 每 一 条 SOL 编译 成 一 个 可 执行 的 节 (section) ， 这 些 节 加 上 其 他 的 一 些 
必要 信息 组 织 成 一 个 DB2 程序 包 ， 并 存储 在 DB2 编目 表 中 。 当 存储 过 程 被 调用 时 ，DB2 从 编 
目 表 中 读 取 对 应 的 DB2 程序 包 直 接 执行 。 


Parameter Marker 〈 参 数 标 记 ) 


动态 SQL 语句 的 一 种 占 位 符 ， 作 为 但 询 的 输入 参数 。 当 编译 SQL 语句 时 可 以 不 指定 这 些 
参数 的 值 ， 而 只 在 执行 时 临时 绑 定 。 使 用 参数 标记 避免 了 对 相似 SQL 语句 的 重复 编译 。 

pureScale 

pureScale 是 一 种 高 可 用 性 集群 数据 库 解 决 方案 。 它 利用 z/OS 大 型 机 上 经 过 验证 的 技术 ， 
在 开放 平台 上 实现 了 基于 共享 磁盘 的 DB2 集群 。 其 突出 优势 表现 在 几乎 无 限制 的 容量 、 应 用 透 
明 性 和 持续 可 用 性 。 


Query Access Plan 


查询 访问 计划 ， 是 DB2 优化 器 为 SQL 语句 生成 的 访问 数据 库 数据 的 方法 。 
RAID (Redundant Array of Independent Disk) 


ARS ERREI, —TPRERIAZLZUEGX. XEM S MR R KAEH. Hm 
大 优点 是 能 提高 存储 系统 的 传输 速率 并 提供 容错 功能 。 
Restore (恢复 ) 


数据 库 恢 复 是 数据 库 备 份 的 诸 过 程 ， 即 使 用 备份 介质 中 的 内 容 上 复 兰 已 有 数据 库 。 
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RCAC (Row and Column Access Control) 


行列 访问 控制 ， 从 DB2 V10 狐 引 入 ， 类 似 于 LBAC 但 使 用 上 更 简便 。 

SMP (Symmetric Multi-Processor) 

单机 多 处 理 器 并 行 ， 允 许多 个 DB2 代理 程序 并 行 执行 单个 查询 ， 从 而 将 复杂 SQL 请 求 的 
执行 分 发 到 各 个 处 理 器 的 并 行 方式 。 

SMS (System Managed Space) 

系统 管理 表 空 间 ， 依 赖 于 底层 操作 系统 来 管理 空间 分 配 和 使 用 。 

Snapshot Monitor (快照 监视 器 ) 


快照 监视 器 是 DB2 提供 的 最 常规 的 监控 方式 ， 它 可 以 让 你 获得 包括 缓冲 池 、 锁 、 排 序 、 话 
句 、 表 等 工作 对 象 在 一 个 指定 的 时 间 点 上 的 状态 映像 , 这 样 一旦 发 现 问题 瓯 可 以 立即 做 初步 分 析 。 
System Catalog (DB2 系统 编目 ) 


DB2 系统 编目 由 很 多 表 和 视图 组 成 ， 这 些 表 和 视图 由 数据 库 管 理 器 来 维护 。 在 创建 一 个 数 
据 库 时 ， 也 会 创建 一 组 编目 表 和 视图 。 这 些 编目 描述 了 数据 库 对 象 ， 例 如 表 、 列 和 索引 ， 并 包 
舍 关 于 用 户 访 问 这 些 对 象 的 权限 信息 。 

Table Partitioning (#3 [X) 


表 中 一 个 或 多 个 字段 作为 表 分 区 键 列 ，DB2 根据 这 些 键 列 的 值 将 表 数 据 分 布 到 多 个 存储 对 
象 〈 称 为 数据 分 区 或 范围 ) 中 。 


Table Space 〈 表 空间 ) 

表 衬 间 是 用 户 定 义 的 存放 数据 库 索 引 、 表 数据 、 临 时 数据 的 旬 辑 空间 。 一 个 对 象 可 以 存放 
i A A 

Transaction (事务 ) 

由 一 个 或 多 个 SQL 语句 组 成 的 工作 单元 。 这 些 工作 单元 被 视 为 一 个 整体 ,如果 都 执行 成 功 ， 
执行 的 结果 束 在 数据 库 中 生效 ， 如 果 任 何 一 个 SQL 执行 失败 ， 则 整个 工作 单元 被 回 深 。 

WAL (Write-Ahead Logging) 


预 写 式 日 志 机 制 ， 它 要 求 在 数据 库 中 更 新 、 插 入 或 删除 的 数据 被 写 入 到 磁盘 之 前 ， 那 些 记 
录 这 些 变化 的 日 六 必须 写 入 到 磁盘 。 


XQuery 


XQuery 是 W3C 所 制定 的 一 套 标准 ， 用 来 从 XML 文档 中 提取 信息 。 针 对 XML 的 XQuery 
语句 非常 类 似 针对 关系 数据 库 的 SQL 语句 。 
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ONE 

IBM RILE, KAIBM DataStudio 
开发 团队 ， 具 有 多 年 的 数据 库 软 件 开发 经 验 ， 擅 
长 解决 各 种 数据 库 应 用 系统 的 性 能 问题 ， 拥 有 IBM 
DB2 各 项 认证 和 Oracle OCP 证 书 。 


FSE 


IBM Data Warehouse/BI 项 目 组 高 级 软件 工 
程 师 ，IBM 认 证 高 级 DBA。 有 丰富 的 数据 仓库 经 
验 ， 在 数据 仓库 健康 检查 和 高 可 用 性 方面 也 有 颇 深 
的 研究 ， 具 有 丰富 的 性 能 调 优 、 实 施 和 客户 支持 经 


验 。 


业内 热 评 : 


本 书 完美 诠释 了 DB2 性 能 优化 艺术 ， 作 者 团队 全 部 是 IBM 中 国 软件 开发 中 心 的 资深 专家 ， 具 有 丰富 的 从 Oracle 向 
DB2 迁 移 实施 经 验 ， 他 们 的 书 一 定 能 带领 广大 的 读者 实现 华丽 的 从 容 转身 。 
一 一 IBM 中 国 开 发 中 心 信 息 管 理 产 品 开 发 部 总 经 理 朱 辉 
这 本 书 是 一 帮 志 同道 合 之 人 写 就 的 DB2 作 品 ， 且 不 说 在 IBM 公 司 和 数据 库 社 区 激 起 巨大 波澜 ， 仅 是 巨大 的 销量 就 足 
以 反映 那些 或 共鸣 、 或 钦佩 的 心态 。 作 为 一 名 从 业 20 多 年 的 数据 库 工 作者 ， 对 书 中 所 阐述 的 IBM 原 厂 “ 正 规 军 ”的 性 能 
优化 战略 战术 深 有 体会 ， 希 望 广大 读者 能 从 中 受益 。 
一 一 IBM 中 国 软 件 部 Executive IT Specialist 沈 刚 
这 本 书 讲述 了 性 能 优化 的 方方面面 ， 涵 盖 物 理 设 计 和 逻辑 设计 ， 涵 盖 性 能 监控 和 参数 调整 ， 涵 盖 SQL 语 句 优 化 。 最 
难得 的 是 作者 分 享 了 两 种 DB2 性 能 调整 方法 学 ， 一 种 是 自 下 而 上 方法 学 ， 强 调 性 能 优化 要 贯穿 设计 、 开 发 和 维护 整个 数 
据 生命 周期 ， 这 无 疑 纠正 了 很 多 认识 上 的 误区 ; 另外 一 种 是 自 下 而 上 方法 学 ， 它 是 作者 多 年 现场 摸 爬 浚 打 的 实战 总 结 。 
一 一 IBM 中 国 软件 部 Consulting IT Specialist 雷 林 
性 能 优化 往往 具有 牵涉 面 广 、 时 间 紧 的 特点 ， 涉 及 客户 、 开 上 帮 商 、 基 础 软件 、 硬 件 设备 等 多 方面 ， 要 求 从 业 人 员 技 
术 全 面 且 具备 良好 的 沟通 协调 能 力 。 作 者 将 自己 在 银行 、 电 信 等 行业 积累 的 实战 案例 精彩 呈现 ， 让 人 身 临 其 境 ， 相 信和 能 
给 读者 在 技术 、 业 务 、 沟 通 等 各 方面 带 来 启发 和 感悟 。 
一 一 海通 证 券 股份 有 限 公司 信息 技术 管理 部 副 总 经 理 王 洪涛 
本 书 作 者 在 为 银行 、 电 信 等 行业 客户 的 技术 服务 中 积累 了 丰富 的 实战 经 验 ， 这 使 得 他 们 能 够 以 广 冰 的 视角 来 看 待 性 
能 优化 工作 。 特 别 是 书 中 有 关 数 据 仓库 的 内 容 ， 讲 解 透彻 清晰 ， 字 字 珠 现 ， 为 这 本 难得 的 上 乘 之 作 锦 上 添 花 。 
一 一 中 信和 银行 资深 数据 架构 师 刘 文 涛 
这 本 书 用 实战 案例 贯穿 DB2 经 典 设计 和 优化 技术 ， 不 落 俗 套 ， 角 度 独特 ， 还 特别 讲述 了 DB2 HADR, pureScale 
等 高 级 架构 设计 与 优化 技术 ， 这 对 于 广大 读者 来 讲 ， 大 可 畅游 其 中 ， 揣 摩 知 识 技 巧 ， 学 习 品 味 技术 人 生 。 
一 一 上 海宝 信和 软件 解决 方案 本 部 研究 所 所 长 兼 技术 总 监 王 森 
应 用 开发 和 数据 库 优 化 我 都 做 过 ， 但 是 一 直 缺 乏 系 统 的 指导 。 所 以 ， 我 一 直 期 待 能 有 一 本 理论 联系 实际 ， 透 彻 分 析 
DB2 性 能 优化 思路 并 结合 实际 案例 的 书 来 提升 技术 水 平 。 这 本 书 大 大 超出 了 我 的 预期 ， 它 真 称 得 上 是 分 析 和 解决 性 能 问 
题 的 神 兵 利 器 。 
一 一 亚信 联 创 科技 (中 国 ) 有 限 公 司 数 据 库 资 深 顾问 郭 占 海 
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如 果 您 对 本 书 内 容 有 疑问 ， 可 发 邮件 至 contact@turingbook.com， 会 有 编辑 或 作 译 者 协助 
答疑 。 也 可 访问 图 灵 社 区 ， 参 与 本 书 讨 论 。 
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